Quale delle seguenti opzioni di passaggi è quella corretta quando si crea un modello predittivo?
Opzione 1:
Prima elimina i predittori più ovviamente cattivi e, se necessario, preelabora i rimanenti, quindi addestra vari modelli con convalida incrociata, scegli i pochi migliori, identifica i predittori migliori che ognuno ha utilizzato, quindi riqualifica quei modelli solo con quei predittori e valuta l'accuratezza di nuovo con convalida incrociata, quindi scegli quello migliore e allenalo sul set di allenamento completo usando i suoi predittori chiave e quindi utilizzalo per prevedere il set di test.
Opzione 2:
Prima elimina i predittori più ovviamente cattivi, quindi preelabora i rimanenti, se necessario, quindi utilizza una tecnica di selezione delle funzionalità come la selezione ricorsiva delle funzionalità (ad es. RFE con rf) con convalida incrociata, ad esempio per identificare il numero ideale di predittori chiave e quali sono questi predittori sono, quindi, formare diversi tipi di modello con convalida incrociata e vedere quale offre la migliore precisione con i principali predittori identificati in precedenza. Quindi allenare di nuovo il migliore di quei modelli con quei predittori sul set di addestramento completo e quindi utilizzarlo per prevedere il set di test.