Quante volte devo tirare un dado per valutarne con sicurezza l'equità?


22

(Mi scuso in anticipo per l'uso del linguaggio laico piuttosto che del linguaggio statistico.)

Se voglio misurare le probabilità di far rotolare ogni lato di uno specifico dado a sei facce specifico entro circa il +/- 2% con una ragionevole sicurezza di certezza, quanti tiri di dado campione sarebbero necessari?

cioè quante volte avrei bisogno di tirare un dado, contando ogni risultato, per essere sicuro al 98% che le probabilità che tiri da ogni parte siano comprese tra il 14,6% e il 18,7%? (O alcuni criteri simili in cui uno sarebbe circa il 98% sicuro che il dado sia giusto entro il 2%.)

(Questa è una preoccupazione nel mondo reale per i giochi di simulazione che usano dadi e vogliono essere certi che alcuni disegni di dadi siano accettabilmente vicini all'1 / 6 possibilità di far rotolare ogni numero. Si dice che molti disegni di dadi comuni siano stati misurati lanciando il 29% 1 di lanciando più di questi dadi 1000 volte ciascuno.)


1
Questo è molto più complicato di trovare l'intervallo di confidenza per un binomio, dal momento che vorresti tenere sotto controllo tutte le probabilità. Dai un'occhiata al documento di Hsiuying Wang sugli intervalli di confidenza simultanei per le distribuzioni multinomiali ( Journal of Multivariate Analysis 2008, 99, 5, 896-911). Puoi trovare un po 'di codice in questo post del blog , che fornisce anche un breve riepilogo di alcune delle attività svolte al riguardo.
idnavid,

1
Nota che se sei solo interessato a verificare se 1 viene lanciato per un bel po 'di tempo, questo semplifica molto la domanda.
Dennis Jaheruddin,

2
È importante notare che "l'intervallo di confidenza" non ti dà una "probabilità percentuale di essere corretta". Ho il sospetto che tu stia usando il ragionevole uso comune del termine "98% sicuro", ma devi sapere ogni volta che qualcuno menziona "intervallo di confidenza" che non corrisponde affatto a una probabilità del 98%: link.springer.com/ articolo / 10.3758% 2Fs13423-013-0572-3
BrianH

1
@BrianH Grazie! Non intendevo solo l'espressione colloquiale, ma sto cercando di quantificare la certezza implicita dal test. Mi sembra che, nello stesso modo in cui ha senso dire che mi aspetto di ottenere un risultato del dado una percentuale calcolabile del tempo, che ci sarebbe un calcolo simile (ma più complesso) per la probabilità che io ottenga risultati all'interno un certo margine di errore in rotolo n volte, che è quello che penso di capire la risposta di Xiamoi (e il commento di follow-up) sta dicendo. Sì?
Dronz,

1
@Dronz Per essere onesti, questa è una di quelle cose che pensi davvero sarebbero più dirette di quanto si pensi realmente. In effetti diabolicamente complicato. Ecco alcune domande chiave correlate altrove per aiutarti a darti un'idea di come non esiste una risposta incredibilmente diretta: Frequentist math.stackexchange.com/questions/1578932/… Bayesian math.stackexchange.com/questions/1584833/… e divertimento: rpg.stackexchange.com/questions/70802/…
BrianH,

Risposte:


18

TL; DR: se = 1/6 e vuoi sapere quanto grande deve essere sicuro al 98% che il dado sia giusto (entro il 2%), deve essere almeno ≥ 766 .pnnn


Sia il numero di tiri e il numero di tiri che atterrano su un lato specificato. Quindi segue una distribuzione binomiale (n, p) in cui è la probabilità di ottenere quel lato specificato.nXXp

Dal teorema del limite centrale, lo sappiamo

n(X/np)N(0,p(1p))

Poiché è la media campionaria di variabili casuali di Bernoulli . Quindi per grandi , gli intervalli di confidenza per possono essere costruiti comeX/nn(p)np

Xn±Zp(1p)n

Poiché è sconosciuto, possiamo sostituirlo con la media del campione , e con vari teoremi di convergenza, sappiamo che l'intervallo di confidenza risultante sarà asintoticamente valido. Quindi otteniamo intervalli di confidenza del modulopp^=X/n

p^±Zp^(1p^)n

con . Presumo che tu sappia quali sono i punteggiAd esempio, se si desidera un intervallo di confidenza al 95%, si prende . Quindi per un dato livello di confidenza abbiamop^=X/nZZ=1.96α

p^±Zαp^(1p^)n

Ora supponiamo che tu voglia che questo intervallo di confidenza sia di lunghezza inferiore a e vuoi sapere quanto è grande un campione di cui abbiamo bisogno per fare questo caso. Bene, questo equivale a chiedere che cosa soddisfaCαnα

Zαp^(1p^)nαCα2

Che è quindi risolto per ottenere

nα(2ZαCα)2p^(1p^)

Quindi inserisci i tuoi valori per ,ZαCαp^nαpn


3
Grazie. Dato che non ho fatto matematica di tipo universitario da decenni, potrei disturbarti a inserire i numeri e a darmi un numero reale di volte in cui dovrei tirare un dado, come un numero intero?
Dronz,

9
p=1/6nnn766Cα

4
Potrebbe essere più interessante esaminare la distribuzione multinomiale, poiché ora testiamo separatamente ciascun lato. Questo non tiene conto di tutte le informazioni che abbiamo sul problema. Per un look intiuitive spiegazione stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm
gen

5
Sono d'accordo con @Jan: questa risposta non risponde alla domanda. Inoltre, non può essere facilmente adattato per costruire una risposta applicandola separatamente a tutte e sei le facce, poiché i sei test sono interdipendenti.
whuber

3
Questa è una bella risposta, ma sono pienamente d'accordo con @Jan, whuber. Questa domanda merita una risposta basata sulla statistica chi-quadro e sulla distribuzione multinomiale.
Łukasz Grad
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.