Domande taggate «random-forest»

La foresta casuale è un metodo di apprendimento automatico basato sulla combinazione dei risultati di molti alberi decisionali.


4
Bisogna preoccuparsi della multi-collinearità quando si usano modelli non lineari?
Supponiamo che abbiamo un problema di classificazione binaria con caratteristiche per lo più categoriche. Usiamo alcuni modelli non lineari (ad esempio XGBoost o Random Forests) per impararlo. Bisogna ancora preoccuparsi della multi-collinearità? Perché? Se la risposta a quanto sopra è vera, come si dovrebbe combatterla considerando che si stanno usando …

1
Valuta foresta casuale: OOB vs CV
Quando valutiamo la qualità di una foresta casuale, ad esempio utilizzando AUC, è più appropriato calcolare queste quantità sui campioni out of bag o sul set di validazione incrociata? Ho sentito che il calcolo su campioni OOB fornisce una valutazione più pessimistica, ma non vedo perché.

3
La foresta casuale e il potenziamento sono parametrici o non parametrici?
Leggendo l'eccellente modellistica statistica: le due culture (Breiman 2001) , possiamo cogliere tutta la differenza tra modelli statistici tradizionali (ad es. Regressione lineare) e algoritmi di apprendimento automatico (ad es. Insaccamento, foresta casuale, alberi potenziati ...). Breiman critica i modelli di dati (parametrici) perché si basano sul presupposto che le …


1
Foresta casuale e previsione
Sto cercando di capire come funziona Random Forest. Ho una comprensione di come vengono costruiti gli alberi, ma non riesco a capire come Random Forest faccia previsioni sul campione fuori borsa. Qualcuno potrebbe darmi una spiegazione semplice, per favore? :)

2
Quando registrare / espandere le variabili quando si utilizzano modelli a foresta casuale?
Sto facendo regressione utilizzando le foreste casuali per prevedere i prezzi in base a diversi attributi. Il codice è scritto in Python usando Scikit-learn. Come decidete se trasformare le variabili usando exp/ logprima di usarle per adattarsi al modello di regressione? È necessario quando si utilizza un approccio Ensemble come …




1
In Random Forest, perché un sottoinsieme casuale di funzionalità viene scelto a livello di nodo anziché a livello di albero?
La mia domanda: Perché la foresta casuale considera sottoinsiemi casuali di funzioni da suddividere a livello di nodo all'interno di ciascun albero anziché a livello di albero ? Sfondo: questa è una questione di storia. Tin Kam Ho pubblicato questo articolo sulla costruzione di "foreste" decision selezionando in modo casuale …


2
Random Forest è adatto a set di dati molto piccoli?
Ho un set di dati che comprende 24 righe di dati mensili. Le caratteristiche sono PIL, arrivi in ​​aeroporto, mese e pochi altri. La variabile dipendente è il numero di visitatori verso una destinazione turistica popolare. Random Forest sarebbe adatto a un simile problema? I dati non sono pubblici, quindi …



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.