In che modo la foresta casuale estrema differisce dalla foresta casuale?

L'implementazione di ER è più efficiente ( Extreme Gradient Boostingè come aumentare il gradiente) - la differenza è importante dal punto di vista pratico? C'è un pacchetto R che li implementa. È un nuovo algoritmo che supera l'implementazione "generica" (pacchetto RandomForest da R) non solo in termini di efficienza o anche in alcune altre aree?

Extreme Random Forest http://link.springer.com/article/10.1007%2Fs10994-006-6226-1

r machine-learning algorithms random-forest

— Qbik
fonte

Questo è piuttosto semplice: RF ottimizza le suddivisioni sugli alberi (cioè seleziona quelli che offrono il miglior guadagno di informazioni rispetto alla decisione) e ERF li rende casuali. Adesso,

costi di ottimizzazione (non molto, ma comunque), quindi ERF è generalmente più veloce.
l'ottimizzazione può contribuire alla correlazione degli alberi nell'insieme o nel sovradimensionamento complessivo, quindi i FER sono probabilmente più robusti, specialmente se il segnale è debole.

Andando ancora oltre in questa direzione, puoi ottenere una velocità extra equalizzando le spaccature su ciascun livello di albero, in questo modo convertendo gli alberi in felci , che sono anche piuttosto interessanti; c'è la mia implementazione R di tale individuo.

Quel collegamento è interrotto, usa CVLAB: Ferns

— smci

Suppongo che gli alberi creati da ERF siano molto più grandi di quelli di RF, perché RF utilizza l'ottimizzazione che comprime la conoscenza dal set di dati su alberi più piccoli

— Qbik