In che modo la foresta casuale estrema differisce dalla foresta casuale?


18

L'implementazione di ER è più efficiente ( Extreme Gradient Boostingè come aumentare il gradiente) - la differenza è importante dal punto di vista pratico? C'è un pacchetto R che li implementa. È un nuovo algoritmo che supera l'implementazione "generica" ​​(pacchetto RandomForest da R) non solo in termini di efficienza o anche in alcune altre aree?

Extreme Random Forest http://link.springer.com/article/10.1007%2Fs10994-006-6226-1

Risposte:


20

Questo è piuttosto semplice: RF ottimizza le suddivisioni sugli alberi (cioè seleziona quelli che offrono il miglior guadagno di informazioni rispetto alla decisione) e ERF li rende casuali. Adesso,

  • costi di ottimizzazione (non molto, ma comunque), quindi ERF è generalmente più veloce.
  • l'ottimizzazione può contribuire alla correlazione degli alberi nell'insieme o nel sovradimensionamento complessivo, quindi i FER sono probabilmente più robusti, specialmente se il segnale è debole.

Andando ancora oltre in questa direzione, puoi ottenere una velocità extra equalizzando le spaccature su ciascun livello di albero, in questo modo convertendo gli alberi in felci , che sono anche piuttosto interessanti; c'è la mia implementazione R di tale individuo.


Quel collegamento è interrotto, usa CVLAB: Ferns
smci

Suppongo che gli alberi creati da ERF siano molto più grandi di quelli di RF, perché RF utilizza l'ottimizzazione che comprime la conoscenza dal set di dati su alberi più piccoli
Qbik
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.