Perché il sistema di classificazione Elo utilizza una regola di aggiornamento errata?


10

Il sistema di classificazione Elo utilizza un algoritmo di minimizzazione della discesa gradiente della funzione di perdita tra entropia tra la probabilità attesa e quella osservata di un risultato nei confronti accoppiati. Possiamo scrivere le funzioni di perdita generali come

E=n,ipiLog(qi)

dove la somma viene eseguita su tutti risultati e tutti gli avversari . è la frequenza osservata dell'evento e la frequenza prevista.inpiiqi

Nel caso di solo due possibili esiti (vittoria o perdita) e un avversario abbiamo

E=pLog(q)(1p)Log(1q)

Se πi è la classifica del giocatore i e πj è la classifica del giocatore j possiamo costruire la probabilità attesa come

qi=eπieπi+eπj
qj=eπjeπi+eπj
quindi la regola di aggiornamento della discesa del gradiente indica l'uso

πi=πiη(qipi)

πj=πjη(qjpj)

dove qi e pi sono la probabilità attesa e osservata di vincita del giocatore i contro il giocatore j . Queste sono le two outcomesregole di aggiornamento.

In presenza di pareggi possiamo generalizzare con probabilità il modello sopra incluso e il terzo risultato

q(d)=νeπi+πj2eπi+eπj+νeπi+πj2
qi(w)=eπieπi+eπj+νeπi+πj2
qj(w)=eπjeπi+eπj+νeπi+πj2

E possiamo costruire la funzione di perdita come

E=p(w)Log(q(w))(1p(w)p(d))Log(q(l))p(d)Log(q(d))

dove sono rispettivamente la probabilità osservata di , e e probabilità attesa di , e . In quest'ultimo caso sarebbe la regola di aggiornamentop(w),p(l),p(d)winloosedrawq(w),q(l),q(d)winloosedraw

πi=πiη(qi(w)+qi(d)2pi(w)pi(d)2)

πj=πjη(qj(w)+qj(d)2pj(w)pj(d)2)

dove e sono le probabilità attese del giocatore di vincere e di pareggiare contro il giocatore . E dove e sono le probabilità osservate del giocatore di vincere e di pareggiare contro il giocatore . Questa è la regola di aggiornamento.qj(w)qj(d)ijpi(w)pi(d)ijthree outcome

La domanda è: perché il sistema di classificazione Elo utilizza le two outcomesregole di aggiornamento anche in presenza di pareggi?

Risposte:


3

La probabilità di disegnare, invece di avere un risultato decisivo, non è specificata nel sistema Elo. Invece viene considerato un pareggio - sia nella prestazione prevista che nel risultato della partita - metà vittoria e metà perdita.

Un esempio dalla pagina Elo di Wikipedia : "Il punteggio atteso da un giocatore è la sua probabilità di vincere più la metà della sua probabilità di pareggio. Pertanto un punteggio atteso di 0,75 potrebbe rappresentare una probabilità del 75% di vincere, il 25% di probabilità di perdere e lo 0% di probabilità di disegno. All'altro estremo potrebbe rappresentare il 50% di possibilità di vincere, lo 0% di probabilità di perdere e il 50% di possibilità di pescare ".

La probabilità di disegnare, come ho detto, non è specificata e porta a una semplice two outcomeregola di aggiornamento, , in cui , quindi, dopo una singola partita, (vittoria) o (pareggio, come mezza vittoria) o (perdita).RA=RA+K(SAEA)SA=1(nw+0.5nd)+0(0.5nd+nl)SA=1SA=0.5SA=0

Come Elo, il sistema Glicko non modella i sorteggi ma effettua un aggiornamento come media di una vincita e una perdita (per giocatore). Invece, nel sistema di classificazione TrueSkill , "i sorteggi sono modellati assumendo che la differenza di prestazione in un determinato gioco sia piccola. Pertanto, la possibilità di disegnare dipende solo dalla differenza della forza di gioco dei due giocatori. Tuttavia, i risultati empirici nel gioco degli scacchi mostrano che i pareggi sono più probabili tra i giocatori professionisti rispetto ai principianti. Pertanto, la possibilità di disegnare sembra dipendere anche dal livello di abilità. "

Questo approccio richiede una modellazione specifica diversa per ogni gioco (e TrueSkill è applicato ad alcuni giochi Microsoft Xbox), quindi è adatto per Elo e Glicko (progettato solo per gli scacchi), e non è per la classifica , il nostro sistema di classificazione multiuso.


"Il punteggio atteso da un giocatore è la sua probabilità di vincere più la metà della sua probabilità di pareggio." è esattamente quello che ho trovato nella formula sopra. Comunque nella formula di aggiornamento di Elo la metà della probabilità di pareggio non è specificata come stai sottolineando. Rimane la domanda: perché nel sistema di ranking Elo non ci interessa il sorteggio?
emanuele,

1
Puoi sempre esprimere il punteggio atteso come la possibilità di vincere e la possibilità di perdere (e zero possibilità di pareggio - vedi il primo esempio da Wikipedia). In questo caso, "il punteggio atteso da un giocatore è la sua probabilità di vincita" (e altro, perché la metà della probabilità di pareggio è zero). Dopo una singola partita, il risultato è una vittoria, una perdita o una mezza vittoria. Anche se hai un gioco in cui sono consentite le estrazioni, puoi aggiornare il punteggio Elo usando solo una combinazione di vincite e perdite, come se le estrazioni non avessero possibilità.
Tomaso Neri,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.