Spero di poter porre questa domanda nel modo corretto. Ho accesso ai dati play-by-play, quindi è più un problema con il miglior approccio e la costruzione corretta dei dati.
Quello che sto cercando di fare è calcolare la probabilità di vincere una partita NHL in base al punteggio e al tempo rimanente nella regolamentazione. Immagino di poter usare una regressione logistica, ma non sono sicuro di come dovrebbe essere il set di dati. Avrei più osservazioni per partita e per ogni intervallo di tempo a cui sono interessato? Avrei avuto un'osservazione per gioco e avrei adattato modelli separati per un intervallo di tempo? La regressione logistica è anche la strada giusta da percorrere?
Qualsiasi aiuto tu possa fornire sarà molto apprezzato!
I migliori saluti.