"Alberi di classificazione e regressione". CART è una popolare tecnica di apprendimento automatico e costituisce la base per tecniche come foreste casuali e implementazioni comuni di macchine per il potenziamento del gradiente.
Le foreste casuali sono considerate scatole nere, ma recentemente stavo pensando a quali conoscenze si possano ottenere da una foresta casuale? La cosa più ovvia è l'importanza delle variabili, nella variante più semplice può essere fatto semplicemente calcolando il numero di occorrenze di una variabile. La seconda cosa a cui …
Il potenziamento dell'albero a gradiente, come proposto da Friedman, utilizza gli alberi decisionali come apprendenti di base. Mi chiedo se dovremmo rendere l'albero delle decisioni di base il più complesso possibile (completamente sviluppato) o più semplice? C'è qualche spiegazione per la scelta? Random Forest è un altro metodo di ensemble …
Qualcuno può spiegare le differenze principali tra gli alberi di inferenza condizionale ( ctreedal partypacchetto in R) rispetto agli algoritmi dell'albero delle decisioni più tradizionali (come rpartin R)? Cosa rende gli alberi CI diversi? Punti di forza e di debolezza? Aggiornamento: ho esaminato il documento di Horthorn e altri a …
Sto iniziando a dilettarsi con l'uso di glmnetcon LASSO Regressione dove il mio risultato di interesse è dicotomica. Di seguito ho creato un piccolo frame di dati finti: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) …
Le mie domande riguardano le foreste casuali. Il concetto di questo bellissimo classificatore mi è chiaro, ma ci sono ancora molte domande pratiche sull'uso. Sfortunatamente, non sono riuscito a trovare alcuna guida pratica alla RF (ho cercato qualcosa come "Una guida pratica per l'addestramento delle macchine Boltzman limitate" di Geoffrey …
Chiunque ha ricevuto suggerimenti sulla libreria o sul codice su come tracciare effettivamente un paio di alberi di esempio da: getTree(rfobj, k, labelVar=TRUE) (Sì, lo so che non dovresti farlo operativamente, RF è una scatola nera, ecc. Ecc. Voglio controllare visivamente la sanità mentale di un albero per vedere se …
Che cos'è "Devianza", come viene calcolata e quali sono i suoi usi in diversi campi nelle statistiche? In particolare, sono personalmente interessato ai suoi usi in CART (e alla sua implementazione in rpart in R). Lo sto chiedendo poiché l' articolo wiki sembra in qualche modo carente e le tue …
Sono nuovo del data mining e sto cercando di formare un albero decisionale su un set di dati che è altamente sbilanciato. Tuttavia, sto riscontrando problemi con scarsa precisione predittiva. I dati sono costituiti dagli studenti che studiano i corsi e la variabile di classe è lo stato del corso …
In An Introduction to Statistical Learning with Applications in R , gli autori scrivono che il montaggio di un albero decisionale è molto veloce, ma questo non ha senso per me. L'algoritmo deve passare attraverso ogni funzione e partizionarla in ogni modo possibile per trovare la divisione ottimale. Per le …
Sto ottenendo una precisione del 100% per il mio albero decisionale. Che cosa sto facendo di sbagliato? Questo è il mio codice: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation …
Gli alberi delle decisioni sembrano essere un metodo di apprendimento automatico molto comprensibile. Una volta creato, può essere facilmente ispezionato da un essere umano, il che è un grande vantaggio in alcune applicazioni. Quali sono i lati pratici deboli degli alberi decisionali?
Sto cercando una spiegazione di come viene calcolata l'importanza della variabile relativa negli alberi potenziati a gradiente che non è eccessivamente generale / semplicistica come: Le misure si basano sul numero di volte in cui una variabile viene selezionata per la divisione, ponderata dal miglioramento quadrato del modello come risultato …
Ho letto in alcune fonti, tra cui questa , che le foreste casuali non sono sensibili ai valori anomali (come lo sono la regressione logistica e altri metodi ML). Tuttavia, due pezzi di intuizione mi dicono diversamente: Ogni volta che viene costruito un albero decisionale, tutti i punti devono essere …
Quali sono alcune linee guida utili per testare i parametri (ad es. Profondità di interazione, minchild, frequenza di campionamento, ecc.) Usando GBM? Diciamo che ho 70-100 funzioni, una popolazione di 200.000 e ho intenzione di testare la profondità di interazione di 3 e 4. Chiaramente ho bisogno di fare alcuni …
Quando si costruisce un modello CART (in particolare l'albero di classificazione) utilizzando rpart (in R), è spesso interessante sapere qual è l'importanza delle varie variabili introdotte nel modello. Pertanto, la mia domanda è: quali misure comuni esistono per classificare / misurare l'importanza delle variabili partecipanti in un modello CART? E …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.