Come creare un sistema di raccomandazione che integra sia il filtro collaborativo che le funzionalità di contenuto?


10

Sto creando un sistema di raccomandazione e voglio incorporare sia le valutazioni degli utenti "simili" sia le caratteristiche degli articoli. L'output ha una valutazione prevista [0-1]. Sto considerando una rete neurale (per cominciare).

Quindi, gli input sono una combinazione delle caratteristiche degli articoli e delle valutazioni di ciascun utente. Per l'articolo A e l'utente 1, il sistema potrebbe essere addestrato sui dati combinati, A1. Questo sarebbe un esempio di addestramento.

E se l'utente 1 avesse anche valutato il film B? Quindi i dati B1 sarebbero anche un esempio di formazione? C'è un problema con la ripetizione dell'allenamento con le funzionalità dell'utente 1 in questo modo?

Hai qualche suggerimento su un modo migliore per affrontare il problema?

Risposte:


11

Perché stai considerando una rete neurale prima di comprendere completamente il problema?

I metodi standard di fattorizzazione a matrice per il filtro collaborativo sono in grado di sfruttare facilmente le funzionalità dei contenuti. Per un esempio di come ciò può essere fatto in un'impostazione bayesiana, consultare il documento Matchbox .


6

Tre articoli sull'integrazione della fattorizzazione a matrice con le funzionalità di contenuto (qui, in particolare il modello di argomento):

  • Deepak Agarwal e Bee-Chung Chen. 2010. fLDA: fattorizzazione a matrice attraverso allocazione diriclet latente. In Atti della terza conferenza internazionale ACM sulla ricerca Web e il data mining (WSDM '10). ACM, New York, NY, USA, 91-100.
  • Hanhuai Shan e Arindam Banerjee. 2010. Factorizations generalizzate a matrice probabilistica per il filtro collaborativo. In Atti della Conferenza internazionale IEEE 2010 sul data mining (ICDM '10). IEEE Computer Society, Washington, DC, USA, 1025-1030.
  • Chong Wang e David M. Blei. 2011. Modellazione di argomenti collaborativi per la raccomandazione di articoli scientifici. Negli atti della 17a conferenza internazionale ACM SIGKDD sulla scoperta della conoscenza e il data mining (KDD '11). ACM, New York, NY, USA, 448-456.

Vorrei anche promuovere il mio post sul blog che discute un po 'di questo problema: i modelli di argomento incontrano i modelli di fattore Lantent


3

Non è necessario un approccio alla rete neurale, il filtro collaborativo è un algoritmo su se stesso. Per il tuo problema specifico, c'è una buona descrizione del sistema cf e recomender su:

ml-class.org

(cerca XVI: Sistemi di raccomandazione). È elegante, semplice e se lo fai nel modo giusto (vale a dire, usa la forma vettoriale, i minimizzatori rapidi e le sfumature preparate) può essere abbastanza veloce.


Ho usato questo approccio, ma non usa le funzionalità degli oggetti. Vorrei includere anche le funzionalità.
B Seven,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.