Esiste qualcuno oggi più veloce di Usain Bolt?


12

EDIT: sono più interessato alle questioni tecniche e alla metodologia per determinare la probabilità di un massimo "vero" in una data popolazione dato un campione statistico. Ci sono problemi con la stima della probabilità di corridori più veloci rispetto a Mr. Bolt da tempi di accelerazione da record che sono sia ovvi che sottili. Humor me immaginando che questo non sia il caso.


Usain Bolt è l'uomo più veloce misurato per il trattino da 100m. Tuttavia, dato il piccolo numero di atleti, sembra probabile che il "vero" essere umano più veloce del mondo sia seduto su un divano da qualche parte e non abbia mai tentato una carriera agonistica.

Sto cercando di usare il fatto che la differenza tra i campioni alle code della distribuzione normale diventa sempre più piccola. Sto usando questo per calcolare la probabilità che esista qualcuno più veloce di Usain Bolt confrontando Usain con il 2 ° più veloce, il 3 ° più veloce e così via.

Per fare questo, sto provando a calcolare il valore più grande che esiste oltre "Usain Bolt" prendendo la derivata del CDF della distribuzione normale rispetto a , portandolo al ° (dove è circa 7.000.000.000 o il numero di campioni inferiori al "massimo" - la logica alla base è descritta nella pagina Wikipedia del problema dei carri armati tedeschi che si generalizza tra le diverse distribuzioni), ad esempio:n nynn

0yfYN(y)dy=λn0y[12[1+erf(yμσ2)]]n112πσ2e(yμ)22σ2dy

  1. È un modo valido per calcolare la probabilità che esista qualcuno più velocemente di Usain Bolt?

  2. Esiste un nome per questo tipo di domanda al di fuori di "German Tank Problem for other distributers"

  3. Esiste un buon modo per stimare la deviazione standard dai campioni estremi di una distribuzione? Trovare informazioni sui trattini da 100m più veloci di tutti i tempi è facile, trovare medie e varianza è difficile)

Grazie per la vostra pazienza nel trattare con un programmatore senza un background nell'argomento.


2
Supponi che se sei un atleta è indipendente dalla tua velocità di corsa. Va bene, ma è discutibile.
Bayerj,

@bayerj Sì, penso sia abbastanza chiaro che questo sarebbe davvero un brutto modo di prevedere il prossimo sfidante olimpico. Tuttavia, sembra una domanda interessante in generale e sto cercando di rispondere al meglio delle mie capacità con la speranza che qualcuno abbia pietà e mi aiuti.
ŹV -

1
Trovo che la domanda sia mal posta poiché la qualità di essere "veloce (er)", qui, si riferisce a un potenziale genetico o al talento atletico e non alla reale capacità di raggiungere l'alta velocità.
Digio,

@Digio Sostituisci "più veloce" con "ha un numero di serie più alto" supponendo che alcune società "Fubarco" faccia un insieme di prodotti con numeri di serie normalmente distribuiti.
ŹV -

1
Motivare una domanda con un esempio è generalmente una buona cosa da fare. Tuttavia, questo esempio sembra distrarre le persone da ciò che stai davvero cercando di chiedere. Potresti modificarlo per discutere della situazione che stai realmente affrontando?
gung - Ripristina Monica

Risposte:


2

Contrariamente ad altre risposte, direi che puoi dire qualcosa sulle abilità di Bolts dati i dati disponibili. Prima di tutto, restringiamo la tua domanda. Stai chiedendo di essere umano più veloce, ma poiché c'è una differenza nelle distribuzioni delle velocità di corsa per uomini e donne, dove la donna che corre meglio sembra essere leggermente più lenta di quella dei corridori migliori, dovremmo concentrarci sui corridori uomini. Per ottenere alcuni dati, possiamo guardare le migliori performance dell'anno su 100 corse degli ultimi 45 anni . Ci sono diverse cose da notare su questi dati:

  • Questi sono i migliori tempi di corsa, quindi non ci parlano delle capacità di tutti gli umani, ma delle velocità minime raggiunte.
  • Partiamo dal presupposto che questi dati riflettano il campione dei migliori corridori del mondo. Mentre potrebbe essere successo che ci fossero corridori ancora migliori che non hanno partecipato ai campionati, questa ipotesi sembra essere abbastanza ragionevole.

Innanzitutto, discutiamo come non analizzare questi dati. Potresti notare che se tracciamo i tempi di esecuzione contro il tempo, osserveremmo una forte relazione lineare.

Migliori tempi di esecuzione vs tempo

Questo potrebbe portarti a utilizzare la regressione lineare per prevedere quanto potremmo osservare i corridori migliori nei prossimi anni. Questa sarebbe comunque una pessima idea, che porterebbe inevitabilmente alla conclusione che in circa duemila anni gli umani sarebbero stati in grado di correre per 100 metri in zero secondi, e dopo che avrebbero iniziato a raggiungere i tempi di corsa negativi! Questo è ovviamente assurdo, poiché possiamo immaginare che ci sia una sorta di limite biologico e fisico delle nostre capacità, che ci è sconosciuto.

X 1 , X 2 , , X n Y i Z 1 , Z 2 , , Z k - Z iY=max(X1,X2,,Xn)X1,X2,,XnYiZ1,Z2,,ZkZisegue una distribuzione GEV per minimas. Quindi possiamo adattare la distribuzione GEV ai dati relativi alla velocità di marcia, il che porta a un adattamento piuttosto piacevole (vedi sotto).

Distribuzione GEV per velocità di marcia

Se si guarda alla distribuzione cumulativa suggerita dal modello, si noterà che il miglior tempo di esecuzione da Usain Bolt è il più basso1%coda della distribuzione. Quindi, se ci atteniamo a questi dati e a questa analisi di esempio giocattolo, concluderemmo che i tempi di esecuzione molto più piccoli sono improbabili (ma ovviamente possibili). Il problema evidente con questa analisi è che ignora il fatto che abbiamo visto miglioramenti di anno in anno dei migliori tempi di funzionamento. Questo ci riporta al problema descritto nella prima parte della risposta, vale a dire che assumere un modello di regressione qui è rischioso. Un'altra cosa che potrebbe essere migliorata è che potremmo usare l'approccio bayesiano e assumere un precedente informativo che spiegherebbe alcune conoscenze fuori dai dati sui tempi di esecuzione fisiologicamente possibili, che potrebbero non essere ancora state osservate (ma, per quanto ne so, questo è sconosciuto al momento). Infine, una simile teoria del valore estremo era già stata utilizzata nella ricerca sportiva, ad esempio da Einmahl e Magnus (2008) nelRecord di atletica leggera attraverso la teoria di valore estremo .

Potresti protestare che non hai chiesto informazioni sulla probabilità di un tempo di corsa più veloce, ma sulla probabilità di osservare un corridore più veloce. Sfortunatamente, qui non possiamo fare molto poiché non sappiamo quale sia la probabilità che un corridore diventi un atleta professionista e che i tempi di corsa registrati siano disponibili per lui. Questo non accade a caso e ci sono molti fattori che contribuiscono al fatto che alcuni corridori diventano atleti professionisti e altri (o addirittura che a qualcuno piace correre e correre). Per questo, dovremmo avere dati dettagliati su tutta la popolazione sui corridori, inoltre, poiché si sta chiedendo gli estremi della distribuzione, i dati dovrebbero essere molto grandi. Quindi, sono d'accordo con le altre risposte.


1

Il mio primo istinto è che questa è una cattiva idea, ma lasciami spezzare un po 'il perché.

1) Vuoi misurare una variabile non osservabile, abilità di corsa latente, con una osservabile, tempi di esecuzione registrati. Va bene, ma: nel problema del serbatoio tedesco, i numeri di serie sono tutti generati dalla stessa distribuzione uniforme. Nel tuo problema, devi dedurre l'abilità variabile latente (di 7 miliardi di persone) dai tempi di funzionamento variabili osservabili. Nel GTP sono noti più numeri di serie. Nel tuo problema, non hai raccolto alcun dato e stai andando al massimo (Bolt). Inoltre, sembra supporre che questa inosservabile abilità latente non sia correlata ai tempi di esecuzione effettivi al punto in cui è possibile che qualcuno che non abbia mai corso sia migliore di Bolt. Sembra assurdo!

2) Gli atleti non sono campioni casuali della popolazione. Sono selezionati con cura da più prove. Se assumiamo che tutti coloro che sono in grado di correre abbiano probabilmente corso qualcuno almeno una volta nella vita e che ogni persona abbia preso una decisione sul fatto che dovrebbero continuare a un livello più elevato di competizione in base alla frequenza o alla quantità con cui li vincono gare --- quindi non sembra così plausibile che Bolt sia davvero l'essere umano più veloce che ci sia.

Questi sono solo i primi motivi che mi vengono in mente. Onestamente, sei un po 'sciocco con questo. Non c'è modo di misurare la "probabilità" del tipo di cosa di cui stai parlando.


Un altro intervistato ha fatto osservazioni simili ed è senza dubbio vero che stimare la probabilità che esista qualcuno più veloce del signor Bolt su questa base è molto imperfetto. Sarebbe anche più interessante sapere se la logica tecnica della previsione basata su questi valori estremi è corretta in linea di principio.
ŹV -

3
Suggerirei quindi di astrarre la domanda per arrivare al cuore di ciò che stai effettivamente cercando di porre, poiché il contesto creerà molta distrazione. Non mi è ancora chiaro quale sia la "distribuzione normale" a cui ti riferisci. Tempi di esecuzione effettivi? Capacità di corsa degli atleti?
Assia degenerata,

-2

La risposta è no.

Stai assumendo che ci sia un campione dalla popolazione (atleti), e Bolt è il massimo in questo campione. Quindi, stai cercando la probabilità che il massimo della popolazione sia maggiore del massimo del campione. Questa è la tua ipotesi.

E se la tua ipotesi fosse sbagliata e che il campione fosse davvero la popolazione?

Posso fare una ragionevole argomentazione sul fatto che ogni persona che può correre ha avuto la possibilità di batterlo. Nessuno l'ha fatto, quindi è il vero massimo della popolazione della Terra.

È chiaro che gli atleti non sono un campione casuale. Spero non ci siano dubbi al riguardo. C'è un certo grado di casualità nel modo in cui si diventa atleti, ovviamente. D'altra parte, se non si è un atleta, le sue capacità atletiche e i suoi risultati non saranno paragonabili all'atleta. Posso pensare che qualcuno POTREBBE POTENZIALMENTE correre più veloce di Bolt, date tutte le condizioni per allenarsi e avere allenato duramente come Bolt. Tuttavia, è zero probabilità che tiri un non atleta e batte Bolt in un trattino di 100 m in condizioni di atletica leggera.


Sono più interessato alla metodologia che sta dietro è corretta, immagina Tanks i cui numeri di serie sono normalmente distribuiti con duplicati invece della velocità di esecuzione forse :)
ŹV -
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.