Conversione di un elenco di classifiche parziali in una classifica globale


13

Sto lavorando a qualcosa come il seguente problema. Ho un sacco di utenti e N libri. Ogni utente crea una classifica ordinata di tutti i libri che ha letto (che è probabilmente un sottoinsieme degli N libri), ad esempio, Libro 1> Libro 40> Libro 25.

Ora voglio trasformare queste classifiche dei singoli utenti in un'unica classifica ordinata di tutti i libri.

Ci sono approcci buoni o standard da provare? Finora, sto pensando ai modelli Bradley-Terry applicati a confronti a coppie, ma mi chiedo se c'è qualcos'altro.


2
Penserei che incontreresti molti problemi con la scarsità, a meno che gli utenti (per qualche ragione) leggano libri simili. Ma date n persone e dato che molte persone leggono relativamente pochi libri, la stragrande maggioranza delle coppie avrà solo una persona che fa il confronto. (Il numero mediano era di 6 per persona all'anno vedi Pew
Peter Flom - Reinstalla Monica

2
(+1) raegtin, fai domande interessanti e piacevoli. Sono appassionato di modelli BT, ma sembra un po 'forzato qui. Conosci la letteratura sui filtri collaborativi? Non è lo stesso problema, ma alcuni concetti e tecniche potrebbero essere presi in prestito. Una domanda che non viene affrontata qui è il motivo per cui si dovrebbe credere che ai libri si possa dare una classifica inequivocabile e ben definita in primo luogo. (Come gestiresti il ​​caso di due utenti e due libri, per esempio?)
Cardinale

@Peter Flom: corretto, la maggior parte delle coppie non ha confronti. Ma spero che vada bene, dato che se sai che A> B e B> C, anche se A e C non sono confrontati direttamente, puoi dedurre A> C.
raegtin

@cardinal: Sì, i modelli BT sembrano forzati qui, ma è l'unica cosa a cui riesco a pensare in questo momento. Ho familiarità con la letteratura sui filtri collaborativi, ma non sono sicuro di come si applichi qui, dal momento che voglio classifiche, non somiglianze. È vero che una singola classifica globale non ha necessariamente senso (ad esempio, ha senso confrontare libri per bambini con libri per adulti? Finzione contro saggistica?), Ma praticamente è ancora utile. "Best of" elenchi di libri sempre
aperti

Inoltre, non mi importa molto degli ordini ravvicinati (ad esempio, se il libro classificato n. 1 è davvero migliore del libro n. 2), ma piuttosto gli ordini in forma aggregata (ad esempio, voglio il 10% superiore dei libri nel mio ordine per essere migliore del 10% inferiore o del 10% medio).
Raegtin,

Risposte:


2

Se sei interessato all'utilizzo (più che allo sviluppo), dovresti provare a classificare , il nostro sistema di classificazione.

Rankade è gratuito e facile da usare, ed è diverso dal modello Bradley-Terry e dal sistema di classificazione Elo (ecco un confronto ) perché può gestire partite con più di 2 fazioni (cioè libri, nel tuo scenario). Inserendo le classifiche ordinate dall'utente (come corrispondenze tra due o più libri, con classifiche finali dettagliate, inclusi i pareggi) otterrai la classifica ordinata singola di tutti i libri che stai cercando. Inoltre, la classifica ti dà l'opportunità di controllare l'evoluzione del tempo per la classifica dei libri e le statistiche per i match-up dei libri e altro ancora.


1
Dovresti descrivere il tuo algoritmo, almeno in generale, come approccio. E link a un documento in cui è descritto per intero. Altrimenti la tua risposta potrebbe essere considerata semplicemente un annuncio.
ttnphns,

1
Ho aggiunto un link per un semplice confronto tra ree e il sistema di classificazione più noto. La prima affermazione dice che se sei interessato all'utilizzo (più che allo sviluppo) , quindi viene proposto come soluzione al problema (la classifica ha una GUI, mentre Bradley-Terry e Plackett-Luce devono essere implementati per essere utilizzati), più che un percorso per raggiungere la soluzione richiesta.
Tomaso Neri,

1

I modelli di classificazione di Plackett-Luce affrontano questo problema e sono una tecnica basata sulla verosimiglianza in cui la verosimiglianza è massimizzata usando una routine di massimizzazione della majorization, che è simile alla Massimizzazione delle aspettative, nel senso che usano una funzione dell'obiettivo ausiliario rispetto alla funzione di verosimiglianza che è ottimizzato per garantire la massimizzazione monotonica iterativa della funzione di verosimiglianza. (vedi algoritmi MM per i modelli di classifica Plackett-Luce di David Hunter). Fornisce anche il codice.

> =

Questo si adatta perfettamente al tuo set di dati:

Libro 1> Libro 40> Libro 25

Libro 40> Libro 30

Libro 25> Libro 17> Libro 11> Libro 3 ecc.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.