Non utilizzare l'approssimazione normale
Molto è stato scritto su questo problema. Un consiglio generale è di non usare mai l'approssimazione normale (cioè l'intervallo di confidenza asintotico / Wald), poiché ha proprietà di copertura terribili. Codice R per illustrare questo:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
Per piccole probabilità di successo, potresti chiedere un intervallo di confidenza del 95%, ma in realtà ottenere un intervallo di confidenza del 10%!
raccomandazioni
Quindi cosa dovremmo usare? Credo che le attuali raccomandazioni siano quelle elencate nel documento Interval Stimation for a Binomial Proportion di Brown, Cai e DasGupta in Statistical Science 2001, vol. 16, n. 2, pagine 101–133. Gli autori hanno esaminato diversi metodi per il calcolo degli intervalli di confidenza e sono giunti alla seguente conclusione.
[W] raccomandiamo l'intervallo Wilson o l'intervallo precedente di Jeffreys dalla coda uguale per la piccola n e l'intervallo suggerito in Agresti e Coull per n più grande .
L'intervallo di Wilson viene talvolta chiamato intervallo di punteggio , poiché si basa sull'inversione di un test di punteggio.
Calcolo degli intervalli
Per calcolare questi intervalli di confidenza, è possibile utilizzare questo calcolatore online o la binom.confint()
funzione nel binom
pacchetto in R. Ad esempio, per 0 successi in 25 prove, il codice R sarebbe:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
Ecco bayes
l'intervallo Jeffreys. (L'argomento type="central"
è necessario per ottenere l' intervallo di coda uguale .)
Si noti che è necessario decidere su quale dei tre metodi si desidera utilizzare prima di calcolare l'intervallo. Guardare tutti e tre e selezionare il più breve ti darà naturalmente una probabilità di copertura troppo piccola.
Una risposta rapida e approssimativa
Come nota finale, se osservi esattamente zero successi nelle tue n prove e desideri solo un intervallo di confidenza approssimativo molto rapido, puoi usare la regola di tre . Basta dividere il numero 3 per n . Nell'esempio precedente n è 25, quindi il limite superiore è 3/25 = 0,12 (il limite inferiore è ovviamente 0).