Non capisco esattamente cosa si intende per dimensione del nodo. So cos'è un nodo decisionale, ma non quale sia la dimensione del nodo.
Non capisco esattamente cosa si intende per dimensione del nodo. So cos'è un nodo decisionale, ma non quale sia la dimensione del nodo.
Risposte:
Un albero decisionale funziona in base alla partizione ricorsiva dell'insieme di addestramento. Ogni nodo di un albero decisionale è associato a un set di n t punti dati dal set di training:
È possibile trovare il parametro nodesize
in alcuni pacchetti di foreste casuali, ad esempio R : questa è la dimensione minima del nodo , nell'esempio sopra la dimensione minima del nodo è 10. Questo parametro imposta implicitamente la profondità dei tuoi alberi.
nodesize
dal pacchetto foresta R casuale
Dimensione minima dei nodi terminali. Se si imposta questo numero su un valore maggiore, gli alberi più piccoli crescono (e quindi richiedono meno tempo). Si noti che i valori predefiniti sono diversi per classificazione (1) e regressione (5).
In altri pacchetti trovi direttamente il parametro depth
, ad esempio WEKA :
-depth
dal pacchetto foresta casuale WEKA
La profondità massima degli alberi, 0 per illimitato. (impostazione predefinita 0)
Non è chiaro se la dimensione del nodo sia sul campionamento "in-bag" o sull'errore "out-of-bag". Se è nel campionamento "out-of-bag", è leggermente più restrittivo.