Differenza di raccomandazione basata sull'oggetto e basata sull'utente in Mahout


15

Vorrei sapere in che modo esattamente i consigli basati sull'utente e quelli basati sugli articoli differiscono l'uno dall'altro.

Lo definisce

Basato sull'utente : consiglia gli articoli trovando utenti simili. Questo è spesso più difficile da ridimensionare a causa della natura dinamica degli utenti.

Basato su articoli : calcola la somiglianza tra gli articoli e formula raccomandazioni. Gli articoli di solito non cambiano molto, quindi spesso possono essere calcolati off line.

Ma sebbene ci siano due tipi di raccomandazioni disponibili, quello che capisco è che entrambi prenderanno alcuni modelli di dati (diciamo 1,2 o 1,2, .5 come item1, item2, value o user1, user2, value dove value non è obbligatorio) e eseguirà tutti i calcoli come misura di somiglianza e raccomandiamo la funzione integrata che abbiamo scelto e possiamo eseguire sia raccomandazioni basate su utenti / articoli sugli stessi dati (è un presupposto corretto ??).

Quindi vorrei sapere come differiscono esattamente e in quali aspetti tutti e due questi algoritmi.

Risposte:


11

Hai ragione che entrambi i modelli funzionano sugli stessi dati senza alcun problema. Entrambi gli articoli operano su una matrice di valutazioni degli articoli dell'utente.

Nell'approccio basato sull'utente l'algoritmo produce una valutazione per un articolo ida parte di un utente ucombinando le valutazioni di altri utenti u'simili u. Simile qui significa che le valutazioni dei due utenti hanno un'alta correlazione di Pearson o somiglianza del coseno o qualcosa di simile.

Nell'approccio voce basata produciamo un voto per iby u, cercando in l'insieme di elementi i'che sono simili a i(nello stesso senso come sopra solo che adesso staremmo guardando i feedback che gli oggetti hanno ricevuto da parte degli utenti), che uha valutato e quindi combina le valutazioni per udi i'in una valutazione prevista uper i.

L'approccio basato sugli articoli è stato inventato su Amazon ( http://dl.acm.org/citation.cfm?id=642471 ) per affrontare le loro sfide di scala con i filtri basati sugli utenti. Il numero di cose che vendono è molto meno e molto meno dinamico del numero di utenti, quindi le somiglianze oggetto-articolo possono essere calcolate offline e accessibili quando necessario.


21

Algoritmo basato su elementi

for every item i that u has no preference for yet

  for every item j that u has a preference for

    compute a similarity s between i and j

    add u's preference for j, weighted by s, to a running average

 return the top items, ranked by weighted average

Algoritmo basato sull'utente

for every item i that u has no preference for yet

 for every other user v that has a preference for i

   compute a similarity s between u and v

   add v's preference for i, weighted by s, to a running average

 return the top items, ranked by weighted average

Articolo vs Utente basato:

1) I segnalatori si adattano al numero di elementi o utenti con cui devono confrontarsi, quindi ci sono scenari in cui ciascun tipo può funzionare meglio dell'altro

2) Le stime di somiglianza tra gli articoli hanno maggiori probabilità di convergere nel tempo rispetto alle somiglianze tra utenti

3) Siamo in grado di calcolare e memorizzare nella cache le somiglianze che convergono, il che può dare un vantaggio in termini di prestazioni ai consiglieri basati sugli articoli

4) I consiglieri basati su articoli iniziano con un elenco di articoli preferiti di un utente e quindi non hanno bisogno di un quartiere degli oggetti più vicino come fanno i consiglieri basati su utenti


Avviso equo: i collegamenti non sono accettati come risposte su questo sito. Raccomando di modificare o eliminare prima di ottenere voti negativi!
Sheldonkreger,

1
molto probabilmente c'è un refuso in "algoritmo basato sull'utente" - la quarta riga dovrebbe iniziare con "aggiungi la preferenza di te per ..."
Bernardo Aflalo,

@BernardoAflalo Non credo sia un errore di battitura, aggiungi la preferenza per tutte le v, quindi prendi una media ponderata
Oswald
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.