In che modo la foresta casuale genera la foresta casuale


20

Non sono un esperto di foreste casuali ma capisco chiaramente che il problema chiave con la foresta casuale è la generazione di alberi (casuali). Puoi spiegarmi come vengono generati gli alberi? (ovvero qual è la distribuzione utilizzata per la generazione di alberi?)

Grazie in anticipo !

Risposte:


16

Le implementazioni di RF differiscono leggermente. So che l' implementazione proprietaria di Salford Systems dovrebbe essere migliore di quella vaniglia in R. Una descrizione dell'algoritmo è in ESL di Friedman-Hastie-Tibshirani, 2a edizione, 3a stampa . Un intero capitolo (15 °) è dedicato alla RF e lo trovo in realtà più chiaro del documento originale. L'algoritmo di costruzione dell'albero è dettagliato a p.588; non è necessario che io lo riproduca qui, poiché il libro è disponibile online.


Grazie mille per la tua risposta ! Ho letto questo libro dalla prima all'ultima pagina, ma penso che fosse l'edizione 1 ... Non sapevo che fosse disponibile online.
Robin Girard,

19

L'idea principale è la procedura di insacco, che non rende gli alberi casuali. Nel dettaglio, ogni albero è costruito su un campione di oggetti disegnati con la sostituzione dal set originale; quindi ogni albero ha alcuni oggetti che non ha visto, che è ciò che rende l'insieme più eterogeneo e quindi migliore nel generalizzare.

Inoltre, gli alberi vengono indeboliti in modo tale che su ciascuna divisione mtryvengano considerati solo M (o ) attributi selezionati casualmente; M è di solito una radice quadrata del numero di attributi nell'insieme. Ciò garantisce che gli alberi vengano ingrassati di meno, poiché non vengono potati. Puoi trovare maggiori dettagli qui .

D'altra parte, esiste una variante di RF chiamata Extreme Random Forest, in cui gli alberi sono realizzati in modo casuale (non c'è ottimizzazione delle suddivisioni) - consultare, penso che questo riferimento .


Scusa, bu non capisco davvero la tua risposta. Cosa intendi con "Nel dettaglio, ogni albero è costruito su un campione di oggetti disegnati con la sostituzione dal set originale" Puoi dare più precisione su dove trovo i dettagli "qui"?
Robin Girard,

1
Ecco come funziona l'insaccamento; controlla en.wikipedia.org/wiki/Bootstrap_aggregating . Ecco un link (difficilmente visibile in quel tema, lo ammetto) al riferimento RF dettagliato.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.