Attualmente sto usando la toolbox RF su MATLAB per un problema di classificazione binaria Set di dati: 50000 campioni e oltre 250 funzioni Quindi quale dovrebbe essere il numero di alberi e la funzione selezionata casualmente su ogni divisione per far crescere gli alberi? qualsiasi altro parametro può influenzare notevolmente …
Supponiamo che abbiamo un problema di classificazione binaria con caratteristiche per lo più categoriche. Usiamo alcuni modelli non lineari (ad esempio XGBoost o Random Forests) per impararlo. Bisogna ancora preoccuparsi della multi-collinearità? Perché? Se la risposta a quanto sopra è vera, come si dovrebbe combatterla considerando che si stanno usando …
Quando valutiamo la qualità di una foresta casuale, ad esempio utilizzando AUC, è più appropriato calcolare queste quantità sui campioni out of bag o sul set di validazione incrociata? Ho sentito che il calcolo su campioni OOB fornisce una valutazione più pessimistica, ma non vedo perché.
Leggendo l'eccellente modellistica statistica: le due culture (Breiman 2001) , possiamo cogliere tutta la differenza tra modelli statistici tradizionali (ad es. Regressione lineare) e algoritmi di apprendimento automatico (ad es. Insaccamento, foresta casuale, alberi potenziati ...). Breiman critica i modelli di dati (parametrici) perché si basano sul presupposto che le …
Sono abbastanza nuovo nell'apprendimento automatico, nelle tecniche CART e simili, e spero che la mia ingenuità non sia troppo ovvia. In che modo Random Forest gestisce strutture dati multilivello / gerarchiche (ad esempio quando l'interazione tra livelli è interessante)? Cioè, set di dati con unità di analisi a diversi livelli …
Sto cercando di capire come funziona Random Forest. Ho una comprensione di come vengono costruiti gli alberi, ma non riesco a capire come Random Forest faccia previsioni sul campione fuori borsa. Qualcuno potrebbe darmi una spiegazione semplice, per favore? :)
Sto facendo regressione utilizzando le foreste casuali per prevedere i prezzi in base a diversi attributi. Il codice è scritto in Python usando Scikit-learn. Come decidete se trasformare le variabili usando exp/ logprima di usarle per adattarsi al modello di regressione? È necessario quando si utilizza un approccio Ensemble come …
Ha senso fare PCA prima di effettuare una classificazione casuale delle foreste? Ho a che fare con dati di testo ad alta dimensione e voglio fare una riduzione delle caratteristiche per evitare la maledizione della dimensionalità, ma le foreste casuali non hanno già una sorta di riduzione della dimensione?
Sto cercando di fare previsioni usando un modello di foresta casuale in R. Tuttavia, ricevo errori poiché alcuni fattori hanno valori diversi nel set di test rispetto al set di training. Ad esempio, un fattore Cat_2ha valori 34, 68, 76, ecc., Nel set di test che non compaiono nel set …
Sto giocando con un randomForest e ho scoperto che generalmente aumentare il sampSize porta a prestazioni migliori. Esiste una regola / formula / ecc. Che suggerisce quale dovrebbe essere il sampSize ottimale o è una cosa di prova ed errore? Immagino un altro modo di esprimerlo; quali sono i miei …
La mia domanda: Perché la foresta casuale considera sottoinsiemi casuali di funzioni da suddividere a livello di nodo all'interno di ciascun albero anziché a livello di albero ? Sfondo: questa è una questione di storia. Tin Kam Ho pubblicato questo articolo sulla costruzione di "foreste" decision selezionando in modo casuale …
Ho letto su questo sito che apparentemente Kinect utilizza l' algoritmo di foreste casuali per l'apprendimento automatico in qualche modo. Qualcuno può spiegare a cosa serve le foreste casuali e come funziona il loro approccio?
Ho un set di dati che comprende 24 righe di dati mensili. Le caratteristiche sono PIL, arrivi in aeroporto, mese e pochi altri. La variabile dipendente è il numero di visitatori verso una destinazione turistica popolare. Random Forest sarebbe adatto a un simile problema? I dati non sono pubblici, quindi …
Mi sono imbattuto nel termine prossimità in foreste casuali. Ma non riuscivo a capire cosa facesse nelle foreste casuali. In che modo aiuta a fini di classificazione?
Quando si codificano le caratteristiche categoriche per la regressione lineare, esiste una regola: il numero di manichini dovrebbe essere uno in meno del numero totale di livelli (per evitare la collinearità). Esiste una regola simile per gli alberi decisionali (in sacchi, potenziati)? Lo sto chiedendo perché una pratica standard in …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.