Misurare l'efficacia del singolo giocatore in 2 giocatori per sport di squadra


19

Ho un foglio di calcolo con i punteggi di alcune squadre. Vince la prima squadra a 10 punti. Ci sono 2 giocatori per squadra. I giocatori giocano sempre con diversi compagni di squadra, anche se non sono scelti in modo perfettamente casuale. Nessun punteggio individuale viene mantenuto.

Quindi in pratica abbiamo Bill e Bob che battono Andy e Alice 10-4 Jake e Bill battono Joe e John 10-8 ...

È possibile trovare una classifica per i singoli giocatori, sulla base di tutti i dati disponibili sulla partita. Fondamentalmente, per vedere quanto ciascun giocatore contribuisce ad ogni partita in termini di punti o rispetto agli altri giocatori?


1
Se qualcosa di tutto ciò è utile e ti interessa vedere un ulteriore sviluppo del semplice adattamento del modello di "punteggio indipendente" al tuo scenario, fammi sapere e cercherò di scriverlo (speriamo un po 'di più concisamente) come risposta separata. Saluti.
cardinale il

Risposte:


13

Di seguito sono riportati un paio di modelli molto semplici . Sono entrambi carenti in almeno un modo, ma forse forniranno qualcosa su cui costruire. Il secondo modello in realtà non affronta (abbastanza) lo scenario del PO (vedere le osservazioni seguenti), ma lo lascio nel caso in cui aiuti in qualche modo.

Modello 1 : una variante del modello Bradley-Terry

Supponiamo di essere principalmente interessati a prevedere se una squadra ne batterà un'altra in base ai giocatori di ciascuna squadra. Possiamo semplicemente registrare se la squadra 1 con i giocatori batte la squadra 2 con i giocatori ( k , ) per ogni partita, ignorando il punteggio finale. Certamente, questo sta gettando via alcune informazioni, ma in molti casi ciò fornisce ancora molte informazioni.(i,j)(k,)

Il modello è quindi

logiot(P(La squadra 1 batte la squadra 2))=αio+αj-αK-α.

Cioè, abbiamo un parametro di "affinità" per ogni giocatore che influenza quanto quel giocatore migliora le possibilità di vincita della sua squadra. Definisci la "forza" del giocatore con . Quindi, questo modello afferma che P (la squadra 1 batte la squadra 2 ) = s i s jSio=eαio

P(La squadra 1 batte la squadra 2)=SioSjSioSj+SKS.

C'è una bella simmetria qui in quanto non importa come la risposta è codificata purché sia ​​coerente con i predittori. Cioè, abbiamo anche

logiot(P(La squadra 2 batte la squadra 1))=αK+α-αio-αj.

Questo può essere in forma facilmente come una regressione logistica con predittori che sono indicatori (uno per ogni giocatore) che assume valore se il giocatore che è sul Team 1 per il gioco in questione, - 1 se lei è in Team 2 e 0 se non lo fa partecipare a quel gioco.+1io10

Da questo abbiamo anche una classifica naturale per i giocatori. Più grande è il (o s ), maggiore è il giocatore migliora la possibilità della sua squadra di vincere. Quindi, possiamo semplicemente classificare i giocatori in base ai loro coefficienti stimati. (Si noti che i parametri di affinità sono identificabili solo fino a un offset comune. Pertanto, è tipico fissare α 1 = 0 per rendere identificabile il modello.)αsα1=0

Modello 2 : punteggio indipendente

NB : Dopo aver riletto la domanda del PO, è evidente che i modelli seguenti non sono adeguati per la sua configurazione. In particolare, l'OP è interessato a una partita che termina dopo che un numero fisso di punti è stato segnato da una squadra o dall'altra. I modelli seguenti sono più appropriati per i giochi che hanno una durata fissa nel tempo. Le modifiche possono essere apportate per adattarsi meglio al quadro del PO, ma richiederebbe una risposta separata per lo sviluppo.

Ora vogliamo tenere traccia dei punteggi. Supponiamo che sia una ragionevole approssimazione che ogni squadra punti punti indipendentemente l'una dall'altra con il numero di punti segnati in qualsiasi intervallo indipendentemente da qualsiasi intervallo disgiunto. Quindi il numero di punti ottenuti da ciascuna squadra può essere modellato come una variabile casuale di Poisson.

ij

log(μ)=γi+γj

Si noti che questo modello ignora i matchup effettivi tra le squadre, concentrandosi esclusivamente sul punteggio.

σi=eγi(i,j)(k,)

P(Team 1 beats Team 2 in sudden death)=σiσjσiσj+σkσ.

ρiδi(i,j)(k,)

log(μ1)=ρi+ρjδkδ
log(μ2)=ρk+ρδiδj

Il punteggio è ancora indipendente in questo modello, ma ora c'è un'interazione tra i giocatori di ogni squadra che influenza il punteggio. I giocatori possono anche essere classificati in base alle loro stime del coefficiente di affinità.

Il modello 2 (e le sue varianti) consente anche la previsione di un punteggio finale.

Estensioni : un modo utile per estendere entrambi i modelli è quello di incorporare un ordine in cui gli indicatori positivi corrispondono alla squadra "di casa" e gli indicatori negativi alla squadra "fuori". L'aggiunta di un termine di intercettazione ai modelli può quindi essere interpretata come un "vantaggio del campo domestico". Altre estensioni potrebbero includere l'incorporazione della possibilità di legami nel Modello 1 (in realtà è già una possibilità nel Modello 2).

Nota a margine : almeno uno dei sondaggi computerizzati (di Peter Wolfe ) utilizzati per la serie Bowl del campionato americano di football americano utilizza il modello (standard) Bradley-Terry per produrre le sue classifiche.


7

L' algoritmo Microsoft TrueSkill , usato per classificare i giocatori su XBox Live, può gestire le partite di squadra, ma non incorpora il margine di vittoria. Potrebbe esserti comunque utile.


1

Sì.

Puoi guardare il record di vittorie / sconfitte di ciascun giocatore e il punto differenziale. Mi rendo conto che è una risposta semplice, ma quelle statistiche sarebbero comunque significative.


Voglio qualcosa di un po 'più complesso di così. Sembra che in media un giocatore contribuisca con un numero X di punti a una partita. Volevo sapere se riuscivo a capire questo o una approssimazione approssimativa in qualche modo.
Bill Waterson,

Vorrei esaminare come Jeff Sagarin fa le sue classifiche di potenza per il calcio universitario e altri sport. La mia ipotesi è che custodisca la sua formula, ma penso che l'abbia fatto mentre era uno studente di master al MIT. Sagarin tiene conto di quanto batti i tuoi avversari, di quanto siano bravi i tuoi avversari e della forza del programma (che potrebbe essere lo stesso di "quanto sono buoni i tuoi avversari.) Penso che un compagno di nome Danny Sheridan abbia un sistema simile. In bocca al lupo.
Adam,

1

(Vorrei aggiungere questo come commento per una risposta precedente, ma la mia reputazione non era abbastanza, per il momento)

Martin O'Leary ha collegato l' algoritmo TrueSkill ed è una buona opzione. Se sei interessato all'utilizzo (più che allo sviluppo), dovresti provare a classificare , il nostro sistema di classificazione. Come TrueSkill può gestire due fazioni con più di un giocatore ciascuna (biliardino 2-vs-2, ping-pong 2-vs-2, basket 3-su-3 e 5-su-5 e altro). Alcune differenze notevoli, tra le altre, sono che la classifica consente la costruzione di fazioni più strutturate (1-contro-1, fazione vs fazione, multiplayer, multifazione, giochi cooperativi, fazioni asimmetriche e altro) e che è gratis da usare.

Ecco un confronto tra i sistemi di classificazione più noti.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.