Quando provo a fare ad esempio una classificazione, il mio approccio attualmente è quello di
- provare prima vari algoritmi e confrontarli
- eseguire la selezione delle funzioni sul miglior algoritmo da 1 in alto
- ottimizzare i parametri utilizzando le funzioni e l'algoritmo selezionati
Tuttavia, spesso non riesco a convincermi che potrebbe esserci un algoritmo migliore di quello selezionato, se gli altri algoritmi sono stati ottimizzati con il miglior parametro / le funzionalità più adatte. Allo stesso tempo, fare una ricerca in tutti gli algoritmi * parametri * caratteristiche richiede troppo tempo.
Qualche suggerimento sul giusto approccio / sequenza?
metodo CV è imparziale solo se tutto il tuo modello è realizzato all'interno del ciclo CV. Quindi fai la selezione delle caratteristiche all'interno del loop CV per la regolazione dei parametri. Può essere fatto facilmente usando l'involucro del filtro nel pacchetto MLR in R.