Sono un po 'nuovo nel datamining / machine learning / ecc. e ho letto un paio di modi per combinare più modelli ed esecuzioni dello stesso modello per migliorare le previsioni.
La mia impressione dalla lettura di un paio di articoli (che sono spesso interessanti e ottimi per la teoria e le lettere greche ma con codice breve ed esempi reali) è che dovrebbe andare così:
Prendo un modello ( knn
, RF
ecc.) E ottengo un elenco di classificatori tra 0 e 1. La mia domanda è: come combinare ciascuno di questi elenchi di classificatori? Eseguo gli stessi modelli sul mio set di allenamento in modo che il numero di colonne che entrano nel modello finale sia lo stesso o c'è qualche altro trucco?
Sarebbe bello se qualche suggerimento / esempio includesse il codice R.
NOTA: questo è per un set di dati con 100k righe nel set di allenamento e 70k nel set di test e 10 colonne.