Nel filtro collaborativo, abbiamo valori che non sono stati inseriti. Supponiamo che un utente non abbia guardato un film, quindi dobbiamo inserire un "na".
Se ho intenzione di prendere un SVD di questa matrice, allora devo inserire un numero in essa - diciamo 0. Ora se fattorizzo la matrice, ho un metodo per trovare utenti simili (scoprendo quali utenti sono più vicini tra loro in lo spazio dimensionale ridotto). Ma la preferenza prevista stessa - per un utente a un articolo sarà zero. (perché è quello che abbiamo inserito nelle colonne sconosciute).
Quindi sono bloccato dal problema del filtro collaborativo vs SVD. Sembrano essere quasi uguali, ma non del tutto.
Qual è la differenza tra loro e cosa succede quando applico un SVD a un problema di filtro collaborativo? L'ho fatto e i risultati sembrano accettabili in termini di ricerca di utenti nelle vicinanze, il che è fantastico, ma come?