Ho dati con alcune migliaia di funzionalità e voglio fare la selezione ricorsiva delle funzionalità (RFE) per rimuovere quelle non informative. Lo faccio con il cursore e RFE. Tuttavia, ho iniziato a pensare, se voglio ottenere la migliore misura di regressione (foresta casuale, ad esempio), quando devo eseguire la regolazione dei parametri ( mtryper RF)? Cioè, se ho capito Caret treni radiofrequenza al più volte su diverse funzionalità sottoinsiemi con mtry fisso. Suppongo che l'ottimale mtrydebba essere trovato al termine della selezione della funzione, ma il mtryvalore che il punto di inserimento utilizza influenza il sottoinsieme selezionato di funzioni? L'utilizzo del cursore con basso mtryè molto più veloce, ovviamente.
Spero che qualcuno possa spiegarmelo.