Come ha affermato Karl Broman nella sua risposta, un approccio bayesiano sarebbe probabilmente molto meglio dell'uso degli intervalli di confidenza.
Il problema con intervalli di confidenza
Perché l'utilizzo degli intervalli di confidenza potrebbe non funzionare troppo bene? Uno dei motivi è che se non si hanno molte valutazioni per un articolo, l'intervallo di confidenza sarà molto ampio, quindi il limite inferiore dell'intervallo di confidenza sarà piccolo. Pertanto, gli elementi senza molte classificazioni finiranno in fondo all'elenco.
Intuitivamente, tuttavia, probabilmente si desidera che gli articoli senza molte classificazioni siano vicini all'elemento medio, quindi si desidera spostare la valutazione stimata dell'articolo verso la valutazione media su tutti gli articoli (ovvero, si desidera spostare la valutazione stimata verso una precedente ) . Questo è esattamente ciò che fa un approccio bayesiano.
Approccio bayesiano I: distribuzione normale su valori nominali
Un modo per spostare la valutazione stimata verso un precedente è, come nella risposta di Karl, utilizzare una stima della forma :w ∗ R + ( 1 - w ) ∗ C
- è la media delle classificazioni degli articoli.R
- C è la media di tutti gli articoli (o di qualsiasi altra cosa in cui desideri ridurre la valutazione).
- Si noti che la formula è solo una combinazione ponderata di e .CRC
- Rvmw = vv + m è il peso assegnato a , dove è il numero di recensioni per la birra e è una sorta di parametro "soglia" costante.Rvm
- Si noti che quando è molto grande, ovvero quando abbiamo molte valutazioni per l'elemento corrente, allora è molto vicino a 1, quindi la nostra valutazione stimata è molto vicina a e prestiamo poca attenzione alla precedente . Quando è piccolo, tuttavia, è molto vicino a 0, quindi la valutazione stimata attribuisce molto peso alla precedente .w R C v w CvwRCvwC
A questa stima, infatti, può essere data un'interpretazione bayesiana come stima posteriore della valutazione media dell'articolo quando le valutazioni individuali provengono da una distribuzione normale centrata su quella media.
Tuttavia, supponendo che i rating provengano da una distribuzione normale ha due problemi:
- Una distribuzione normale è continua , ma le valutazioni sono discrete .
- Le valutazioni per un articolo non seguono necessariamente una forma gaussiana unimodale. Ad esempio, forse il tuo articolo è molto polarizzante, quindi le persone tendono a dargli un punteggio molto alto o a un punteggio molto basso.
Approccio bayesiano II: distribuzione multinomiale rispetto alle valutazioni
Quindi, invece di assumere una distribuzione normale per le classifiche, ipotizziamo una distribuzione multinomiale . Cioè, dato un elemento specifico, c'è una probabilità che un utente casuale gli darà 1 stella, una probabilità che un utente casuale gli darà 2 stelle e così via.p 2p1p2
Naturalmente, non abbiamo idea di quali siano queste probabilità. Man mano che otteniamo sempre più valutazioni per questo articolo, possiamo supporre che sia vicino a , dove è il numero di utenti che gli hanno assegnato 1 stella e è il numero totale di utenti che hanno valutato l'oggetto, ma quando iniziamo per la prima volta, non abbiamo nulla. Quindi posizioniamo un Dirichlet precedente su queste probabilità.n 1p1n1nn1n D i r ( α1, ... , αK)
Cos'è questo Dirichlet prima? Possiamo pensare a ciascun parametro come a un "conteggio virtuale" del numero di volte in cui una persona virtuale ha assegnato l'elemento stelle. Ad esempio, se , e tutti gli altri sono uguali a 0, allora possiamo pensare a questo come a dire che due persone virtuali hanno dato l'oggetto 1 stella e una persona virtuale ha dato l'oggetto 2 stelle. Quindi, prima ancora di ottenere qualsiasi utente reale, possiamo utilizzare questa distribuzione virtuale per fornire una stima della valutazione dell'articolo.αioioα1= 2α2= 1αio
[Un modo di scegliere i parametri sarebbe quello di serie pari alla percentuale complessiva dei voti stelle. (Nota che i parametri non sono necessariamente numeri interi.)]αioαioioαio
Quindi, una volta che arrivano le valutazioni effettive, aggiungi semplicemente i loro conteggi ai conteggi virtuali del tuo Dirichlet prima. Ogni volta che vuoi stimare la valutazione del tuo articolo, prendi semplicemente la media di tutte le valutazioni dell'articolo (sia le sue valutazioni virtuali che le sue effettive).