Qual è la vera risposta alla domanda di compleanno?


13

"Quanto deve essere grande una classe per avere la probabilità di trovare almeno due persone con lo stesso compleanno del 50%?"

Ho 360 amici su Facebook e, come previsto, la distribuzione dei loro compleanni non è affatto uniforme. Ho un giorno con quello che ha 9 amici con lo stesso compleanno. (9 mesi dopo le grandi festività e il giorno di San Valentino sembrano essere grandi, lol ..) Quindi, dato che alcuni giorni sono più probabili per un compleanno, presumo che il numero di 23 sia un limite superiore.

C'è stata una stima migliore di questo problema?


3
Un campione di 360 persone non costituisce un campione di grandi dimensioni per la distribuzione di compleanni per 365 giorni all'anno ... Non si può certo verificare l'uniformità su un campione così piccolo.
Xi'an,

Una persona ha un compleanno, quali sono le probabilità che una seconda persona non condivida lo stesso compleanno? 364/365, quali sono le probabilità che una terza persona non condivida nessuno dei due compleanni? (364/365) * (363/365). Espandi fino a quando hai una probabilità < 50%. Significherebbe la probabilità che nessuno compia lo stesso compleanno, il che a sua volta significherebbe che le probabilità per almeno due di condividere un compleanno sarebbero > 50%.
zzzzBov

8
Dobbiamo presumere che tu abbia amici a caso ?
James,

1
1365 di essere tuo. Il PO sta chiedendo che cosa la stima sarebbe quando dire di essere nato il 1 gennaio non è probabile che, come nascere il Feb 15.
probabilityislogic

Risposte:


18

Fortunatamente qualcuno ha pubblicato alcuni dati di compleanno autentici con un po 'di discussione su una domanda correlata (è la divisa di distribuzione). Possiamo usare questo e ricampionare per dimostrare che la risposta alla tua domanda è apparentemente 23 - la stessa della risposta teorica .

> x <- read.table("bdata.txt", header=T)
> birthday <- data.frame(date=as.factor(x$date), count=x$count)
> summary(birthday) 
      date         count     
 101    :  1   Min.   : 325  
 102    :  1   1st Qu.:1266  
 103    :  1   Median :1310  
 104    :  1   Mean   :1314  
 105    :  1   3rd Qu.:1362  
 106    :  1   Max.   :1559  
 (Other):360                 
> results <- rep(0,50)
> reps <-2000 # big number needed as there is some instability otherwise
> for (i in 1:50)
+ {
+ count <- 0
+ for (j in 1:reps)
+ {
+ samp <- sample(birthday$date, i, replace=T, prob=birthday$count)
+ count <- count + 1*(max(table(samp))>1)
+ }
+ results[i] <- count/reps
+ }
> results
 [1] 0.0000 0.0045 0.0095 0.0220 0.0210 0.0395 0.0570 0.0835 0.0890 0.1165
[11] 0.1480 0.1770 0.1955 0.2265 0.2490 0.2735 0.3105 0.3350 0.3910 0.4165
[21] 0.4690 0.4560 0.5210 0.5310 0.5745 0.5975 0.6240 0.6430 0.6950 0.7015
[31] 0.7285 0.7510 0.7690 0.8025 0.8225 0.8280 0.8525 0.8645 0.8685 0.8830
[41] 0.8965 0.9020 0.9240 0.9435 0.9350 0.9465 0.9545 0.9655 0.9600 0.9665

8
In effetti, si può dimostrare tramite la convessità di Schur che per ogni distribuzione non uniforme di compleanni, la probabilità di una corrispondenza è almeno pari a quella del caso uniforme. Questo è l' Esercizio 13.7 di J. Michael Steele, Il Master Class di Cauchy-Schwarz: un'introduzione all'arte delle disuguaglianze matematiche , Cambridge University Press, 2004, pag. 206 .
cardinale il

2
@ Xi'an: davvero. Ora, se solo conoscessi qualcuno che ha fatto recensioni di libri per una rivista di statistiche di alta qualità e con molti lettori, suggerirei di rivederlo per dare maggiore visibilità agli statistici ... ma dove trovare una persona del genere ...
cardinale il

3
(Per coloro che potrebbero chiedersi quale sia il mio commento immediatamente precedente, fa riferimento al fatto che @ Xi'an è il recensore del libro di nuova nomina per Chance .)
cardinale

2
@ Xi'an, controllare questo fuori e vedere cosa ne pensi: table(replicate(10^5, max(tabulate(sample(1:365,360,rep=TRUE))))).
whuber

3
Probabilmente non è chiaro, tranne R cognoscenti, che il codice nei commenti precedenti di me e @ Xi'an simula la situazione del PO. La sua esecuzione stabilisce che la probabilità che 9 o più persone condividano un compleanno, su 360 scelte a caso da una popolazione distribuita uniformemente, è solo di circa 40 su 100.000. Il valore più probabile per il numero massimo di compleanni condivisi è 5.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.