Ho dati con alcune migliaia di funzionalità e voglio fare la selezione ricorsiva delle funzionalità (RFE) per rimuovere quelle non informative. Lo faccio con il cursore e RFE. Tuttavia, ho iniziato a pensare, se voglio ottenere la migliore misura di regressione (foresta casuale, ad esempio), quando devo eseguire la regolazione dei parametri ( mtry
per RF)? Cioè, se ho capito Caret treni radiofrequenza al più volte su diverse funzionalità sottoinsiemi con mtry fisso. Suppongo che l'ottimale mtry
debba essere trovato al termine della selezione della funzione, ma il mtry
valore che il punto di inserimento utilizza influenza il sottoinsieme selezionato di funzioni? L'utilizzo del cursore con basso mtry
è molto più veloce, ovviamente.
Spero che qualcuno possa spiegarmelo.