"Alberi di classificazione e regressione". CART è una popolare tecnica di apprendimento automatico e costituisce la base per tecniche come foreste casuali e implementazioni comuni di macchine per il potenziamento del gradiente.
Quando si codificano le caratteristiche categoriche per la regressione lineare, esiste una regola: il numero di manichini dovrebbe essere uno in meno del numero totale di livelli (per evitare la collinearità). Esiste una regola simile per gli alberi decisionali (in sacchi, potenziati)? Lo sto chiedendo perché una pratica standard in …
Ho trovato molti articoli che affermano che i metodi di potenziamento sono sensibili ai valori anomali, ma nessun articolo spiega il perché. Nella mia esperienza, i valori anomali sono dannosi per qualsiasi algoritmo di apprendimento automatico, ma perché i metodi di potenziamento sono particolarmente sensibili? In che modo i seguenti …
Qual è la funzione di costo migliore per un albero forestale casuale: indice Gini o entropia? Sto cercando di implementare una foresta casuale a Clojure.
Sono curioso dell'implementazione pratica di una divisione binaria in un albero decisionale, in quanto si riferisce ai livelli di un predittore categorico .XjXjX{j} Nello specifico, spesso userò una sorta di schema di campionamento (ad es. Insaccamento, sovracampionamento, ecc.) Quando creerò un modello predittivo usando un albero decisionale, al fine di …
In questa domanda: esiste un metodo per costruire alberi decisionali che tenga conto dei predittori strutturati / gerarchici / multilivello? - menzionano un metodo di dati del pannello per gli alberi. Esistono metodi dati pannello specifici per il supporto di macchine vettoriali e reti neurali? In tal caso, potresti citare …
Penso che questa sia una domanda semplice, anche se il ragionamento alla base del perché o del perché potrebbe non esserlo. Il motivo per cui mi chiedo è che di recente ho scritto la mia implementazione di una RF e sebbene funzioni bene, non sta funzionando come mi aspettavo (basato …
Quando si tratta di alberi decisionali, il valore previsto può essere al di fuori dell'intervallo dei dati di addestramento? Ad esempio, se l'intervallo del set di dati di allenamento della variabile target è 0-100, quando generi il mio modello e lo applico a qualcos'altro, i miei valori possono essere -5? …
Qualcuno può spiegarmi quando utilizzare l'impurità di Gini e il guadagno di informazioni per gli alberi delle decisioni? Potete darmi situazioni / esempi di quando è meglio usare quale?
Sono un po 'nuovo nel data mining e sto lavorando a un modello di classificazione per la previsione della valutazione dei film. Ho raccolto set di dati da IMDB e sto pianificando di utilizzare un albero decisionale e gli approcci vicini più vicini per il mio modello. Vorrei sapere quale …
Una foresta casuale è una raccolta di alberi decisionali formata selezionando casualmente solo alcune funzionalità con cui costruire ciascun albero (e talvolta inserendo i dati di addestramento). Apparentemente imparano e generalizzano bene. Qualcuno ha fatto il campionamento MCMC dello spazio dell'albero decisionale o li ha confrontati con foreste casuali? So …
C'è un modo in cui una volta costruito un albero di classificazione complesso usando rpart (in R), per organizzare le regole di decisione prodotte per ogni classe? Quindi, invece di ottenere un albero enorme, otteniamo un insieme di regole per ciascuna delle classi? (se é cosi, come?) Ecco un semplice …
Sto lavorando con alcuni grandi set di dati usando il pacchetto gbm in R. Sia la mia matrice predittore che il mio vettore di risposta sono piuttosto scarsi (cioè la maggior parte delle voci sono zero). Speravo di costruire alberi decisionali usando un algoritmo che sfrutti questa scarsità, come è …
Se consideriamo un albero decisionale completamente sviluppato (ovvero un albero decisionale non potato) ha una varianza elevata e una propensione bassa. Le foreste insaccanti e casuali utilizzano questi modelli ad alta varianza e li aggregano al fine di ridurre la varianza e quindi migliorare l'accuratezza delle previsioni. Entrambe le foreste …
Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …
Voglio implementare Adaboost usando Decision Stump. È corretto prendere la stessa quantità di decisione che le caratteristiche del nostro set di dati in ogni iterazione di Adaboost? Ad esempio, se ho un set di dati con 24 funzionalità, dovrei avere un classificatore di 24 stump delle decisioni in ogni iterazione? …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.