Sto lavorando a un sistema di raccomandazione di libri molto semplice. Voglio sapere cosa fare con i campi che non sono classificati dall'utente quando trovano la somiglianza del coseno, dovremmo ignorarli e calcolare solo con i campi classificati o dovremmo contrassegnarli come 0.
Il libro che sto seguendo dice di escludere i campi poiché fornirà un'interpretazione errata in caso di correlazione Euclidea e Pearson, ma in caso di Cosine Somiglianza, porta tutti i campi non classificati a 0.
Qualcuno può spiegare perché è necessario rendere i campi non classificati a 0 solo per Coseno e non altri o esiste un modo diverso per farlo. (So come rendere i campi 0 in Euclide e Pearson influenzano il risultato ma non sono sicuro del coseno)