Sto lavorando con il set di dati MovieLens10M, prevedendo le valutazioni degli utenti. Se voglio valutare equamente il mio algoritmo, come devo dividere i miei dati di allenamento v. Test?
Per impostazione predefinita, credo che i dati siano suddivisi in set di test treno v. In cui 'test' contiene filmati precedentemente non visti nel set di addestramento. Se il mio modello richiede che ogni film sia stato visto almeno una volta nel set di formazione, come devo dividere i miei dati? Devo prendere tutte tranne N le classificazioni di ciascun utente per tutti i dati e valutare le mie prestazioni sulle classifiche NxUser_num date?