Gli algoritmi di machine learning possono prevedere i punteggi o le giocate sportive?


40

Ho una serie di set di dati NFL che penso possano costituire un buon progetto collaterale, ma non ho ancora fatto nulla con loro.

Venire su questo sito mi ha fatto pensare agli algoritmi di machine learning e mi chiedevo quanto potessero essere bravi a predire il risultato dei giochi di calcio o persino il gioco successivo.

Mi sembra che ci sarebbero alcune tendenze che potrebbero essere identificate - al 3 ° down e 1, una squadra con un forte ritorno in teoria dovrebbe avere la tendenza a correre la palla in quella situazione.

Il punteggio potrebbe essere più difficile da prevedere, ma la squadra vincente potrebbe esserlo.

La mia domanda è se queste sono buone domande da porre a un algoritmo di apprendimento automatico. È possibile che mille persone lo abbiano già provato, ma la natura dello sport lo rende un argomento inaffidabile.

Risposte:


18

Ci sono molte buone domande sul calcio (e sugli sport, in generale) che sarebbe fantastico lanciare su un algoritmo e vedere cosa ne viene fuori. La parte difficile è sapere cosa lanciare all'algoritmo.

Una squadra con un buon RB potrebbe semplicemente passare al 3 ° e al corto solo perché gli avversari probabilmente si aspetterebbero di correre, per esempio. Quindi, al fine di produrre effettivamente alcuni risultati meritevoli, rompevo il problema in pezzi più piccoli e li analizzavo statisticamente mentre li lanciavo sulle macchine.

Ci sono alcuni (buoni) siti Web che provano a fare lo stesso, dovresti controllarli e usare tutto ciò che hanno trovato per aiutarti:

E se vuoi veramente esplorare Sports Data Analysis, dovresti assolutamente controllare i video della Sloan Sports Conference . Ce ne sono molti sparsi su Youtube.


13

Sì. Perchè no?! Con così tanti dati registrati in ogni sport in ogni partita, un uso intelligente dei dati potrebbe portarci a ottenere importanti spunti sulle prestazioni dei giocatori.

Qualche esempio:

Quindi, sì, l'analisi statistica dei record dei giocatori può darci informazioni su quali giocatori hanno maggiori probabilità di esibirsi ma non su quali giocatori si esibiranno . Quindi, l'apprendimento automatico, un cugino stretto dell'analisi statistica si dimostrerà un punto di svolta.


9

Sicuramente possono. Posso indirizzarti su un bel foglio . Una volta l'ho usato per l'implementazione dell'algoritmo di predizione dei risultati della lega di calcio, con l'obiettivo principale di avere un certo valore contro i bookmaker.

Dall'estratto di carta:

un modello generalizzato bayesiano per stimare le abilità che dipendono dal tempo di tutte le squadre di una lega e per prevedere le partite di calcio del prossimo fine settimana.

parole chiave:

Modelli dinamici, modelli lineari generalizzati, modelli grafici, metodi Markov Chain Monte Carlo, previsione delle partite di calcio

Citazione:

Rue, Havard e Oyvind Salvesen. "Previsione e analisi retrospettiva delle partite di calcio in una lega." Journal of the Royal Statistical Society: Series D (The Statistician) 49.3 (2000): 399-418.


7

L'apprendimento automatico e le tecniche statistiche possono migliorare la previsione, ma nessuno può prevedere il risultato reale.

Qualche mese fa è stata organizzata una competizione di pronostici sulla previsione del torneo NCAA 2014 . Puoi leggere il Forum della competizione per avere un'idea migliore di ciò che le persone hanno fatto e dei risultati che hanno ottenuto.


7

È stato dimostrato prima che le tecniche di apprendimento automatico possono essere applicate per prevedere i risultati sportivi. La semplice ricerca su Google dovrebbe darti un sacco di risultati.

Tuttavia, è stato anche dimostrato (per NFL tra l'altro) che modelli predittivi molto complessi, semplici modelli predittivi, domande alle persone o conoscenza della folla utilizzando le informazioni sulle scommesse, si comportano tutti più o meno allo stesso modo. Fonte: " Tutto è ovvio una volta che conosci la risposta - Il buon senso fallisce ", capitolo 7, di Duncan Watts.


Interessante. Il motivo per cui ho posto la domanda è che mi chiedevo se qualcosa di simile alla "fallacia del giocatore" (o addirittura alla stessa gf). Ho pensato che ci potesse essere una possibilità che fosse già stata dimostrata un'iniziativa infruttuosa. Tuttavia, queste altre risposte sono intriganti.
Steve Kallestad,

6

Michael Maouboussin, nel suo libro "The Success Equation", guarda alla differenziazione della fortuna dall'abilità in vari sforzi, incluso lo sport. In realtà classifica gli sport per la quantità di fortuna che contribuisce alla prestazione nei diversi sport (p. 23) e circa i 2/3 della prestazione nel calcio sono attribuibili all'abilità. Al contrario, ho usato la tecnica di MM per analizzare le prestazioni nelle corse di Formula 1 e ho scoperto che il 60% è attribuibile all'abilità (meno di quanto mi aspettassi).

Detto questo, sembra che questo tipo di analisi implicherebbe che un set di funzionalità sufficientemente dettagliato e realizzato consentirebbe agli algoritmi ML di prevedere le prestazioni dei team NFL, forse anche a livello di gioco, con l'avvertenza che esisterà ancora una varianza significativa a causa dell'influenza di fortuna nel gioco.



5

Ho fatto delle ricerche in questo settore. Ho scoperto che le catene Markov del primo ordine funzionano bene per prevedere all'interno delle dinamiche di punteggio di gioco in una varietà di sport.

Puoi leggere più in dettaglio qui: http://www.epjdatascience.com/content/3/1/4


5

Non possono prevedere, ma possono dirti il ​​risultato più probabile. C'è uno studio su questo tipo di approccio da parte di Etienne : prevedere chi vincerà la Coppa del mondo con Wolfram Language . Questo è uno studio molto dettagliato, quindi puoi controllare tutta la metodologia utilizzata per ottenere le previsioni.

Abbastanza interessante, 11 delle 15 partite erano corrette!

Come ci si potrebbe aspettare, il Brasile è il favorito, con una probabilità di vincere del 42,5%. Questo risultato sorprendente è dovuto al fatto che il Brasile ha sia il più alto ranking Elo che gioca in casa.

(Andiamo in Brasile!)


3

Molte persone hanno sottolineato quali sono le cose che possono essere previste nelle loro risposte. Ora, con il fascino per l'apprendimento profondo, potresti, ad esempio, utilizzare RNN (diciamo LSTM) per prevedere i risultati per problemi sportivi basati sul tempo. Questi sono all'avanguardia e battono i modelli tradizionali a mani basse.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.