Probabilità di nascere in un giorno bisestile?


31

Dato che oggi è un giorno bisestile, qualcuno conosce la probabilità di nascere in un giorno bisestile?


30
Nota che le nascite non sono distribuite uniformemente durante tutto l'anno, quindi la probabilità che un giorno scelto casualmente sia un giorno bisestile non è la stessa probabilità di nascere in uno.
Ben Millwood,

17
Da chi nasce? Tutte le persone nella storia? Oggi? Tutte le persone vive? Prospetticamente verso il futuro? Le probabilità sono insignificanti a meno che gli eventi a cui si riferiscono non siano ben definiti.
whuber

15
Lo sarà il 100% delle persone nate oggi. Questo aiuta?
aslum,

8
Molti genitori non vogliono che i loro figli nascano il giorno bisestile. Quindi, con l'aumento delle sezioni C programmate, la probabilità sarà inferiore a un giorno casuale. fivethirtyeight.com/features/…
James Lawruk,

3
Sono d'accordo con @whuber, che la domanda è mal definita. Senza una corretta definizione dello spazio di probabilità alla domanda non è possibile rispondere. Da qui il downvote.
mpiktas,

Risposte:


24

Sicuro. Vedi qui per una spiegazione più dettagliata: http://www.public.iastate.edu/~mlamias/LeapYear.pdf .

Ma sostanzialmente l'autore conclude: "Ci sono 485 anni bisestili in 2 millenni. Quindi, in 2 millenni, ci sono giorni totali. Di quei giorni, il 29 febbraio si verifica in 485 di loro (gli anni bisestili), quindi la probabilità è "485 / 730.485 = ,0006,639424 millions485(366)+(2000485)(365)=730485485/730485=0.0006639424


9
Perché non può essere calcolato come 1 / (Numero di giorni in 4 anni) = 1/1461 = 0.00068 ?
Siddhesh,

21
@Siddhesh C'è una regola riguardante i secoli. Ad esempio, il 2100 non è un anno bisestile
Rentrop,

8
@Siddhesh, Sfortunatamente, non è così semplice. Gli anni bisestili sono un po 'più complessi. La durata media di un anno è in realtà di 365.2425 giorni non di 365.25. Come scritto sulla pagina dell'anno bisestile di Wikipedia, "Il calendario gregoriano ... rimuove tre giorni bisestili ogni 400 anni, che è la durata del suo ciclo bisestile. Questo viene fatto rimuovendo il 29 febbraio negli anni del tre secolo (multipli di 100) che non può essere esattamente diviso per 400. [3] Gli anni 2000 e 2400 sono anni bisestili, mentre 1800, 1900, 2100, 2200, 2300 e 2500 sono anni comuni. "
StatStudent,

10
Non vedo perché devi considerare 2000 anni; gli anni bisestili hanno un ciclo di 400 anni, quindi perché non limitarsi a "ci sono 97 anni bisestili in 400 anni"?
Philip Kendall,

7
Perché dovremmo considerare influenze minori come giorni "saltati" negli anni del secolo non multipli di 400 ma d'altra parte non tenere conto delle influenze esterne, come quasi tutte le nascite ritardate o introdotte prima del 29 febbraio, solo per salvare il bambino dall'inconveniente (o altri motivi)? - Almeno qui in Germania la probabilità che si verifichi un parto il 29 febbraio è (stimata) quasi zero.
Sono con Monica il

23

Per prevedere con precisione tale probabilità utilizzando le statistiche, sarebbe utile sapere dove è avvenuta la nascita.

Questa pagina http://chmullig.com/2012/06/births-by-day-of-year/ ha un grafico che mostra un sottoinsieme del numero di nascite al giorno (moltiplicando il 29 per 4, che è errato e indesiderabile per questa domanda, ma si collega anche ai dati originali e fornisce un'indicazione approssimativa di cosa ci si può aspettare) negli Stati Uniti. Suppongo che questa curva non sia vera per altri paesi, e specialmente non per altri continenti. In particolare, l'emisfero australe e la regione equatoriale possono mostrare una sostanziale derivazione da questi risultati, assumendo che il clima sia un fattore determinante.

Inoltre, c'è il problema della "nascita elettiva" (toccato dagli autori di http://bmjopen.bmj.com/content/3/8/e002920.full ) - nelle regioni più povere del globo, mi aspetterei un diverso distribuzione delle nascite, semplicemente perché le sezioni cesarie (non di emergenza) o le nascite indotte sono più rare rispetto ai paesi sviluppati. Questo distorce la distribuzione finale delle nascite.

Usando i dati americani, ipotizzando ~ 71 milioni di nascite (media graficamente approssimativa * 366) e 46.000 nascite il 29 febbraio, non correggendo la distribuzione degli anni bisestili nei dati, poiché il periodo preciso non è indicato, arrivo a una probabilità di circa ~ 0.000648. Questo è leggermente al di sotto del valore che ci si aspetterebbe data una distribuzione piatta delle nascite, e quindi in linea con l'impressione generale data dal grafico.

Lascerò un test di significatività di questa stima approssimativa a un lettore motivato. Ma dato che il 29 ° (sebbene non corretto - il 2000 inietta una tendenza al di sotto della media nei dati) ottiene punteggi bassi anche per gli standard di febbraio già bassi, presumo una fiducia relativamente elevata che l'ipotesi nulla di uguale distribuzione possa essere respinta.


1
Il set di dati ha le date di nascita del 30 e 31 febbraio. È divertente. Ha bisogno di una buona pulizia prima dell'analisi, ma ha molti dati che sono fantastici.
Aksakal

22

Penso che la risposta a questa domanda possa essere solo empirica. Qualsiasi risposta teorica sarebbe viziata senza i fenomeni di selezione del compleanno, la stagionalità ecc. Queste cose sono impossibili da affrontare teoricamente.

I dati sul compleanno sono difficili da trovare negli Stati Uniti per motivi di privacy. C'è un set di dati anonimi qui . Viene dalle domande di assicurazione negli Stati Uniti. La differenza rispetto ad altri rapporti, come un popolare articolo del NYT spesso citato , è che elenca la frequenza delle nascite per data, anziché una semplice classifica dei giorni in un anno. Il punto debole è ovviamente la tendenza al campionamento, poiché proviene dall'assicurazione: le persone non assicurate non sono incluse ecc.

Secondo i dati, nel 29 febbraio ci sono state 325 nascite per un totale di 481040. Secondo Roy Murphy , il campione si estende dal 1981 al 1994. Comprende 3 anni bisestili per un totale di 14 anni. Senza alcun aggiustamento la probabilità sarebbe dello 0,0675% di essere nata il 29 febbraio tra il 1981 e il 1994.

14/12pFo=325fL=3

Fo=fL/NFp,
N=14F=481040

pL1/4PL

PL=pLppLNfLFoF0.079%

p

p=NfLFoF0.32%

PLp

Naturalmente, questa discussione era incentrata sugli Stati Uniti. Chissà quali sono gli schemi in altri paesi.

AGGIORNAMENTO: abbiamo assunto automaticamente che OP fosse un calendario gregoriano. Diventa ancora più interessante se consideri diversi calendari come il calendario lunare Hijri , dove gli anni bisestili sono ogni 30 anni circa.

AGGIORNAMENTO 2:

pFp=1,527Amitabh Chandra, Harvard University

Ora, quanto è probabile che quei giorni molto particolari nel calendario gregoriano: 1 gennaio, 25 dicembre e 29 dicembre verrebbero casualmente come i compleanni più popolari? Dico che è altamente improbabile un evento casuale. Quindi, è ancora più interessante vedere cosa sta succedendo in altri calendari come Hijri.

AGGIORNAMENTO 3:

PL,p

p^1/3660.27
P^Lp3663654+10.068

AGGIORNAMENTO 4:

χ2

14365+3

d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs

idL = 60; % index of Feb 29

% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days

fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;

fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))

% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on

% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)

PRODUZIONE:

non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000

h =

     1


p =

     0

inserisci qui la descrizione dell'immagine


3
È un'analisi utile (+1). Mi viene da chiedersi quale sia l'eventuale connessione tra le frequenze che analizzi e la probabilità (vagamente definita) richiesta nella domanda.
whuber

1
@whuber, le probabilità nella mia risposta sono per casi come l'analisi di applicazioni assicurative o alcuni dati degli utenti. Ad esempio, si dispone di un sito Web e si desidera contrassegnare i dati utente problematici. È possibile confrontare la frequenza dei compleanni del 29 febbraio con le mie probabilità. Tuttavia, se stai pianificando una famiglia e fai questa domanda, i miei numeri sono inutili, praticamente. Il motivo è che non tengono conto di fattori come quando esattamente la coppia si sta effettivamente copiando o la fertilità e i modelli di periodo delle coppie, ad esempio, che è il principale determinante della data del giorno di nascita.
Aksakal,

Sono contento di vedere che non hai iniziato con la matematica prima di considerare altri fattori, al di là delle statistiche pure
TheBlastOne

8

La copertina del mio libro preferito fornisce mai prove estremamente rilevanti contro l'assunzione di un'assegnazione uniforme delle nascite alle date. In particolare, le nascite negli Stati Uniti dal 1970 mostrano diverse tendenze sovrapposte l'una all'altra: una tendenza lunga, pluridecennale, una tendenza non periodica, tendenze del giorno della settimana, tendenze del giorno dell'anno, tendenze delle vacanze (perché procedure come il cesareo sezione consente di pianificare in modo efficace la data di nascita, e spesso i medici non lo fanno in vacanza). Il risultato è che la probabilità di nascere in un giorno scelto casualmente in un anno non è uniforme, e poiché il tasso di natalità varia tra gli anni, non tutti gli anni sono ugualmente probabili.

Ciò fornisce anche la prova che la soluzione di Asksal, sebbene contendente molto forte, è anche incompleta. Un piccolo numero di giorni bisestili sarà "contaminato" da tutti gli effetti in gioco qui, quindi la stima di Asksal sta anche catturando (quasi per caso) l'effetto delle tendenze del giorno della settimana e a lungo termine insieme al 29 febbraio effetto. Quali effetti sono e non sono appropriati da includere non sono chiaramente definiti dalla tua domanda.

E questa analisi riguarda solo gli Stati Uniti, che hanno tendenze demografiche che potrebbero essere abbastanza diverse dalle altre nazioni o popolazioni. Il tasso di natalità del Giappone è in calo da decenni, ad esempio. Il tasso di natalità della Cina è regolato dallo stato, con alcune conseguenze per la composizione di genere della sua nazione e quindi i tassi di natalità nelle generazioni successive.

Allo stesso modo, l'analisi di Gelman descrive solo alcuni decenni recenti e non è necessariamente chiaro che questa sia anche l'era di interesse per la tua domanda.

inserisci qui la descrizione dell'immagine

Per coloro che sono entusiasti di questo genere di cose, il materiale in copertina è discusso a lungo nel capitolo sui processi gaussiani.


2
Una breve descrizione del modello utilizzato è disponibile anche nel post del blog qui: andrewgelman.com/2012/06/19/…
Sakari Cajanus

3

Il 29 febbraio è una data che si verifica ogni anno un multiplo di 4 .

Tuttavia, gli anni che sono un multiplo di 100 ma che non sono uno di 400, non sono considerati anni bisestili (ad esempio: 1900 non è un anno bisestile mentre 2000 o 1600 lo sono). Pertanto, al giorno d'oggi, è lo stesso modello ogni 400 anni.

Quindi facciamo i calcoli su un intervallo [0; 400 [

Per un periodo di 400 anni, ci sono esattamente 4 x 25 = 100 anni che sono un multiplo di 4 . Ma dobbiamo sottrarre 3 (anni multipli di 100 ma non di 400) da 100 e otteniamo 100 - 3 = 97 anni.

Ora dobbiamo moltiplicare 97 per 366, 97 x 366 = 35502 (numero di giorni in un anno bisestile in un periodo di 400 anni), rimane (365 x (400-97)) = 110 595 (numero di giorni che non sono ' t in un anno bisestile in un periodo di 400 anni).

Quindi non ci resta che aggiungere questi due numeri per conoscere il numero totale di giorni in un periodo di 400 anni: 110 595 + 35502 = 146 097 .

Per finire, la nostra probabilità è il numero del 29 febbraio in un periodo di 400 anni, quindi 97 dato che ci sono 97 anni bisestili divisi per il numero totale di giorni del nostro intervallo:

p = 97/146097 ≈ 0.0006639424492

Spero che sia giusto e chiaro.


7
Questa è una bella analisi della possibilità che una data scelta casualmente sia il 29 febbraio. Credo che la maggior parte della discussione in questo thread si concentri sul fatto che questo non risponde effettivamente alle domande sulle possibilità di nascite, che in realtà non si comportano come estrazioni casuali dall'insieme dei giorni possibili.
whuber

1
Un modo molto più semplice è quello di dire che ci sono 97 anni bisestili per 400 anni nel modo in cui ti sei già allenato. Calcola il numero di giorni in 400 anni normali. 400 * 365 = 146000. Quindi devi aggiungere i 97 giorni bisestili che danno 146097.
CJ Dennis

2

Credo che ci siano due domande confuse qui. Il primo è "Qual è la probabilità che un determinato giorno sia un 29 febbraio?". Il secondo è (e quello effettivamente chiesto) "Qual è la probabilità di nascere in un giorno bisestile?"

p=971460970,00066394

3149740097400143=6796001.131667

01


2
Errr, ero pronto a votare questo, e poi sono arrivato a Well, per chiunque sia già nato è facile. È 0 o 1. No.
mattdm

Immagino che questo dipenda un po 'dall'interpretazione delle probabilità. Supponiamo che io abbia lanciato una moneta. L'ho guardato e conosco il risultato (es. Teste). Sei in piedi accanto a me, ma non hai visto il risultato. Qual è la probabilità che la moneta mostri delle teste (per te, per me, "oggettivamente")? Nell'esempio sopra: per la persona (nata) data la probabilità è 0 o 1 (supponendo che sappia in quale data è nata). Se scegli una persona a caso e hai dovuto indovinare il suo compleanno, la probabilità che sia un 29 febbraio è di nuovo una domanda empirica.
data_enthusiast

1

Ho notato che la maggior parte delle risposte sopra risolve il problema calcolando il numero di giorni bisestili in un determinato periodo. Esiste un modo più semplice per ottenere la risposta, con precisione al 100%, per definizione:

Usiamo gli anni bisestili per adattare il normale calendario (365 giorni) all'anno medio tropicale (noto anche come anno solare). L'anno tropicale medio "è il tempo impiegato dal Sole per ritornare nella stessa posizione nel ciclo delle stagioni, come visto dalla Terra" (Wikipedia). L'anno tropicale varia leggermente, ma l'anno tropicale (medio) medio è di 365.24667.

Se i giorni bisestili sono corretti, allora la possibilità che un giorno selezionato casualmente sia un giorno bisestile è ((anno tropicale) - (anno non bisestile)) / anno tropicale

Inserendo il numero approssimativo che abbiamo, è (365.24667-365) /365.24667 o 0.24667 / 365.24667 o 675 per milione (0,0675%).

Questo, tuttavia, è per un giorno selezionato casualmente. Immagino che ciò sia sostanzialmente distorto dai genitori che preferirebbero non dover spiegare ai loro figli "il tuo compleanno effettivo arriva solo una volta ogni 4 anni".


3
Non credo che questo risponda alla domanda, perché il giorno bisestile, il 29 febbraio, esiste solo in particolari sistemi di calendario. Tali sistemi di calendario sono stati utilizzati solo in società particolari durante le recenti ere storiche. Ad esempio, questa domanda non è comprensibile a qualcuno che calcola il tempo usando il calendario ebraico, che non ha affatto "febbraio"! Inoltre, anche se assumiamo un calendario con un giorno bisestile, non risolve ancora l'indeterminatezza che circonda la distribuzione di probabilità delle nascite in giorni.
Sycorax dice di ripristinare Monica

@ user777, questo è irrilevante. Se appartieni a una cultura che non riconosce il giorno bisestile, ci sarebbero comunque individui nati nel nostro giorno bisestile.
Polpo

1
@Octopus Non se fossero nati prima dell'ottobre 1582, il mese in cui fu introdotto il calendario gregoriano. La domanda non è abbastanza specifica da consentire di discernere quali popolazioni sono in esame, motivo per cui il mio commento è di fondamentale importanza.
Sycorax dice di ripristinare Monica

@utente777, stai dividendo i peli. Il punto è che il calendario gregoriano esiste oggi e può essere utilizzato per inserire ogni singolo giorno nella storia, indipendentemente dal fatto che lo abbiano osservato in quel momento.
Polpo

1
@Octopus Come fai a sapere che è questo il punto?
Sycorax dice di ripristinare Monica

-4

Ho chiesto a mia sorella, il cui compleanno è il 29 febbraio, e lei ha detto: "Il risultato del mio studio empirico è stato che è ovviamente l'1,00".


Bene, sembra che non sia stato apprezzato. Notato.
John Smith,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.