Dato che oggi è un giorno bisestile, qualcuno conosce la probabilità di nascere in un giorno bisestile?
Dato che oggi è un giorno bisestile, qualcuno conosce la probabilità di nascere in un giorno bisestile?
Risposte:
Sicuro. Vedi qui per una spiegazione più dettagliata: http://www.public.iastate.edu/~mlamias/LeapYear.pdf .
Ma sostanzialmente l'autore conclude: "Ci sono 485 anni bisestili in 2 millenni. Quindi, in 2 millenni, ci sono giorni totali. Di quei giorni, il 29 febbraio si verifica in 485 di loro (gli anni bisestili), quindi la probabilità è "485 / 730.485 = ,0006,639424 millions
Per prevedere con precisione tale probabilità utilizzando le statistiche, sarebbe utile sapere dove è avvenuta la nascita.
Questa pagina http://chmullig.com/2012/06/births-by-day-of-year/ ha un grafico che mostra un sottoinsieme del numero di nascite al giorno (moltiplicando il 29 per 4, che è errato e indesiderabile per questa domanda, ma si collega anche ai dati originali e fornisce un'indicazione approssimativa di cosa ci si può aspettare) negli Stati Uniti. Suppongo che questa curva non sia vera per altri paesi, e specialmente non per altri continenti. In particolare, l'emisfero australe e la regione equatoriale possono mostrare una sostanziale derivazione da questi risultati, assumendo che il clima sia un fattore determinante.
Inoltre, c'è il problema della "nascita elettiva" (toccato dagli autori di http://bmjopen.bmj.com/content/3/8/e002920.full ) - nelle regioni più povere del globo, mi aspetterei un diverso distribuzione delle nascite, semplicemente perché le sezioni cesarie (non di emergenza) o le nascite indotte sono più rare rispetto ai paesi sviluppati. Questo distorce la distribuzione finale delle nascite.
Usando i dati americani, ipotizzando ~ 71 milioni di nascite (media graficamente approssimativa * 366) e 46.000 nascite il 29 febbraio, non correggendo la distribuzione degli anni bisestili nei dati, poiché il periodo preciso non è indicato, arrivo a una probabilità di circa ~ 0.000648. Questo è leggermente al di sotto del valore che ci si aspetterebbe data una distribuzione piatta delle nascite, e quindi in linea con l'impressione generale data dal grafico.
Lascerò un test di significatività di questa stima approssimativa a un lettore motivato. Ma dato che il 29 ° (sebbene non corretto - il 2000 inietta una tendenza al di sotto della media nei dati) ottiene punteggi bassi anche per gli standard di febbraio già bassi, presumo una fiducia relativamente elevata che l'ipotesi nulla di uguale distribuzione possa essere respinta.
Penso che la risposta a questa domanda possa essere solo empirica. Qualsiasi risposta teorica sarebbe viziata senza i fenomeni di selezione del compleanno, la stagionalità ecc. Queste cose sono impossibili da affrontare teoricamente.
I dati sul compleanno sono difficili da trovare negli Stati Uniti per motivi di privacy. C'è un set di dati anonimi qui . Viene dalle domande di assicurazione negli Stati Uniti. La differenza rispetto ad altri rapporti, come un popolare articolo del NYT spesso citato , è che elenca la frequenza delle nascite per data, anziché una semplice classifica dei giorni in un anno. Il punto debole è ovviamente la tendenza al campionamento, poiché proviene dall'assicurazione: le persone non assicurate non sono incluse ecc.
Secondo i dati, nel 29 febbraio ci sono state 325 nascite per un totale di 481040. Secondo Roy Murphy , il campione si estende dal 1981 al 1994. Comprende 3 anni bisestili per un totale di 14 anni. Senza alcun aggiustamento la probabilità sarebbe dello 0,0675% di essere nata il 29 febbraio tra il 1981 e il 1994.
Naturalmente, questa discussione era incentrata sugli Stati Uniti. Chissà quali sono gli schemi in altri paesi.
AGGIORNAMENTO: abbiamo assunto automaticamente che OP fosse un calendario gregoriano. Diventa ancora più interessante se consideri diversi calendari come il calendario lunare Hijri , dove gli anni bisestili sono ogni 30 anni circa.
AGGIORNAMENTO 2:
Amitabh Chandra, Harvard University
Ora, quanto è probabile che quei giorni molto particolari nel calendario gregoriano: 1 gennaio, 25 dicembre e 29 dicembre verrebbero casualmente come i compleanni più popolari? Dico che è altamente improbabile un evento casuale. Quindi, è ancora più interessante vedere cosa sta succedendo in altri calendari come Hijri.
AGGIORNAMENTO 3:
AGGIORNAMENTO 4:
d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs
idL = 60; % index of Feb 29
% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days
fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;
fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))
% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on
% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)
PRODUZIONE:
non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000
h =
1
p =
0
La copertina del mio libro preferito fornisce mai prove estremamente rilevanti contro l'assunzione di un'assegnazione uniforme delle nascite alle date. In particolare, le nascite negli Stati Uniti dal 1970 mostrano diverse tendenze sovrapposte l'una all'altra: una tendenza lunga, pluridecennale, una tendenza non periodica, tendenze del giorno della settimana, tendenze del giorno dell'anno, tendenze delle vacanze (perché procedure come il cesareo sezione consente di pianificare in modo efficace la data di nascita, e spesso i medici non lo fanno in vacanza). Il risultato è che la probabilità di nascere in un giorno scelto casualmente in un anno non è uniforme, e poiché il tasso di natalità varia tra gli anni, non tutti gli anni sono ugualmente probabili.
Ciò fornisce anche la prova che la soluzione di Asksal, sebbene contendente molto forte, è anche incompleta. Un piccolo numero di giorni bisestili sarà "contaminato" da tutti gli effetti in gioco qui, quindi la stima di Asksal sta anche catturando (quasi per caso) l'effetto delle tendenze del giorno della settimana e a lungo termine insieme al 29 febbraio effetto. Quali effetti sono e non sono appropriati da includere non sono chiaramente definiti dalla tua domanda.
E questa analisi riguarda solo gli Stati Uniti, che hanno tendenze demografiche che potrebbero essere abbastanza diverse dalle altre nazioni o popolazioni. Il tasso di natalità del Giappone è in calo da decenni, ad esempio. Il tasso di natalità della Cina è regolato dallo stato, con alcune conseguenze per la composizione di genere della sua nazione e quindi i tassi di natalità nelle generazioni successive.
Allo stesso modo, l'analisi di Gelman descrive solo alcuni decenni recenti e non è necessariamente chiaro che questa sia anche l'era di interesse per la tua domanda.
Per coloro che sono entusiasti di questo genere di cose, il materiale in copertina è discusso a lungo nel capitolo sui processi gaussiani.
Il 29 febbraio è una data che si verifica ogni anno un multiplo di 4 .
Tuttavia, gli anni che sono un multiplo di 100 ma che non sono uno di 400, non sono considerati anni bisestili (ad esempio: 1900 non è un anno bisestile mentre 2000 o 1600 lo sono). Pertanto, al giorno d'oggi, è lo stesso modello ogni 400 anni.
Quindi facciamo i calcoli su un intervallo [0; 400 [
Per un periodo di 400 anni, ci sono esattamente 4 x 25 = 100 anni che sono un multiplo di 4 . Ma dobbiamo sottrarre 3 (anni multipli di 100 ma non di 400) da 100 e otteniamo 100 - 3 = 97 anni.
Ora dobbiamo moltiplicare 97 per 366, 97 x 366 = 35502 (numero di giorni in un anno bisestile in un periodo di 400 anni), rimane (365 x (400-97)) = 110 595 (numero di giorni che non sono ' t in un anno bisestile in un periodo di 400 anni).
Quindi non ci resta che aggiungere questi due numeri per conoscere il numero totale di giorni in un periodo di 400 anni: 110 595 + 35502 = 146 097 .
Per finire, la nostra probabilità è il numero del 29 febbraio in un periodo di 400 anni, quindi 97 dato che ci sono 97 anni bisestili divisi per il numero totale di giorni del nostro intervallo:
p = 97/146097 ≈ 0.0006639424492
Spero che sia giusto e chiaro.
Credo che ci siano due domande confuse qui. Il primo è "Qual è la probabilità che un determinato giorno sia un 29 febbraio?". Il secondo è (e quello effettivamente chiesto) "Qual è la probabilità di nascere in un giorno bisestile?"
Ho notato che la maggior parte delle risposte sopra risolve il problema calcolando il numero di giorni bisestili in un determinato periodo. Esiste un modo più semplice per ottenere la risposta, con precisione al 100%, per definizione:
Usiamo gli anni bisestili per adattare il normale calendario (365 giorni) all'anno medio tropicale (noto anche come anno solare). L'anno tropicale medio "è il tempo impiegato dal Sole per ritornare nella stessa posizione nel ciclo delle stagioni, come visto dalla Terra" (Wikipedia). L'anno tropicale varia leggermente, ma l'anno tropicale (medio) medio è di 365.24667.
Se i giorni bisestili sono corretti, allora la possibilità che un giorno selezionato casualmente sia un giorno bisestile è ((anno tropicale) - (anno non bisestile)) / anno tropicale
Inserendo il numero approssimativo che abbiamo, è (365.24667-365) /365.24667 o 0.24667 / 365.24667 o 675 per milione (0,0675%).
Questo, tuttavia, è per un giorno selezionato casualmente. Immagino che ciò sia sostanzialmente distorto dai genitori che preferirebbero non dover spiegare ai loro figli "il tuo compleanno effettivo arriva solo una volta ogni 4 anni".
Ho chiesto a mia sorella, il cui compleanno è il 29 febbraio, e lei ha detto: "Il risultato del mio studio empirico è stato che è ovviamente l'1,00".