Vorrei creare una foresta casuale usando il seguente processo:
- Costruisci un albero su un campione casuale di dati e caratteristiche usando il guadagno delle informazioni per determinare le divisioni
- Terminare un nodo foglia se supera una profondità predefinita O qualsiasi divisione comporterebbe un conteggio delle foglie inferiore a un minimo predefinito
- Anziché assegnare un'etichetta di classe per ciascun albero, assegnare la proporzione di classi nel nodo foglia
- Smetti di costruire alberi dopo che è stato costruito un numero predefinito
Ciò contrasta il tradizionale processo di foresta casuale in due modi. Uno, utilizza alberi potati che assegnano proporzioni anziché etichette di classe. E due, il criterio di arresto è un numero predeterminato di alberi piuttosto che una stima di errore out-of-bag.
La mia domanda è questa:
Per il processo sopra riportato che genera N alberi, posso quindi adattare un modello usando la regressione logistica con la selezione LASSO? Qualcuno ha esperienza nell'adattare un classificatore a foresta casuale e la post-elaborazione con LASSO logistico?
Il framework ISLE menziona l'uso di LASSO come fase di post-elaborazione per problemi di regressione ma non per problemi di classificazione. Inoltre, non ottengo risultati utili quando si cerca su Google "Lazo casuale della foresta".