"Alberi di classificazione e regressione". CART è una popolare tecnica di apprendimento automatico e costituisce la base per tecniche come foreste casuali e implementazioni comuni di macchine per il potenziamento del gradiente.
Random Forests (RFs) è un metodo di modellazione / mining di dati competitivo. Un modello RF ha un'uscita: la variabile di uscita / previsione. L'approccio ingenuo alla modellazione di più uscite con RF sarebbe quello di costruire una RF per ogni variabile di uscita. Quindi abbiamo N modelli indipendenti e …
Nella routine rpart () per creare modelli CART, si specifica il parametro di complessità su cui si desidera eliminare l'albero. Ho visto due diversi consigli per la scelta del parametro complessità: Scegliere il parametro di complessità associato all'errore minimo possibile con convalida incrociata. Questo metodo è raccomandato da Quick-R e …
Supponiamo di avere due alberi di regressione (albero A e albero B) che mappa ingresso di uscita y ∈ R . Let y = f A ( x ) per l'albero A e f B ( x ) per l'albero B. Ogni albero utilizza spaccature binari, con iperpiani come le …
Sto lavorando alla misura di importanza della funzione Gini per la foresta casuale. Pertanto, devo calcolare la diminuzione di Gini nell'impurità del nodo. Ecco il modo in cui lo faccio, che porta a un conflitto con la definizione, suggerendo che devo sbagliarmi da qualche parte ... :) Per un albero …
È passato un po 'di tempo da quando ho visto gli alberi di partizionamento. L'ultima volta che ho fatto questo genere di cose, mi piace la festa in R (creata da Hothorn). L'idea dell'inferenza condizionale tramite campionamento ha senso per me. Ma anche rpart aveva un fascino. Nell'attuale applicazione (non …
In realtà sto scrivendo un'implementazione di Random Forests ma credo che la domanda sia specifica per gli alberi delle decisioni (indipendentemente dalle RF). Quindi il contesto è che sto creando un nodo in un albero decisionale e sia la previsione che le variabili target sono continue. Il nodo ha una …
Domande Dipende se l'albero è poco profondo o profondo? O possiamo dire questo indipendentemente dalla profondità / livelli dell'albero? Perché il bias è basso e la varianza è alta? Spiega in modo intuitivo e matematico
Poiché l'algoritmo dell'albero decisionale si divide su un attributo in ogni fase, la profondità massima di un albero decisionale è uguale al numero di attributi dei dati. È corretto?
Versione breve: sto cercando un pacchetto R in grado di costruire alberi decisionali mentre ogni foglia dell'albero decisionale è un modello di regressione lineare completo. AFAIK, la libreria rpartcrea alberi decisionali in cui la variabile dipendente è costante in ogni foglia. Esiste un'altra libreria (o rpartun'impostazione di cui non sono …
Un collega nel mio ufficio mi ha detto oggi "I modelli di alberi non sono buoni perché vengono catturati da osservazioni estreme". Una ricerca qui ha portato a questa discussione che sostanzialmente supporta l'affermazione. Il che mi porta alla domanda: in quale situazione un modello CART può essere robusto e …
Qualcuno può aiutare a spiegare alcune delle matematiche alla base della classificazione in CART? Sto cercando di capire come accadono due fasi principali. Ad esempio, ho addestrato un classificatore CART su un set di dati e ho usato un set di dati di prova per contrassegnare le prestazioni predittive ma: …
Una foresta casuale è una raccolta di alberi decisionali che seguono il concetto di insacco. Quando passiamo da un albero decisionale all'albero decisionale successivo, in che modo le informazioni apprese dall'ultimo albero decisionale passano al successivo? Perché, secondo la mia comprensione, non esiste nulla come un modello addestrato che viene …
Sono abbastanza nuovo nell'apprendimento automatico, nelle tecniche CART e simili, e spero che la mia ingenuità non sia troppo ovvia. In che modo Random Forest gestisce strutture dati multilivello / gerarchiche (ad esempio quando l'interazione tra livelli è interessante)? Cioè, set di dati con unità di analisi a diversi livelli …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 5 mesi fa . Esiste una buona libreria Python per l'addestramento di alberi decisionali potenziati?
Normalmente non possiamo disegnare una curva ROC per i classificatori discreti come gli alberi delle decisioni. Ho ragione? Esiste un modo per disegnare una curva ROC per Dtrees?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.