Keith Winstein,
EDIT: Giusto per chiarire, questa risposta descrive l'esempio fornito nella risposta Keith Winstein sul re con il crudele gioco statistico. Le risposte Bayesiana e Frequentista utilizzano entrambe le stesse informazioni, ovvero ignorare le informazioni sul numero di monete giuste e ingiuste durante la costruzione degli intervalli. Se queste informazioni non vengono ignorate, il frequentatore dovrebbe usare la probabilità beta-binomiale integrata come distribuzione campionaria nella costruzione dell'intervallo di confidenza, nel qual caso l'intervallo di confidenza Clopper-Pearson non è appropriato e deve essere modificato. Un aggiustamento simile dovrebbe avvenire nella soluzione bayesiana.
EDIT: ho anche chiarito l'uso iniziale del clopper Pearson Interval.
EDIT: ahimè, la mia alfa è la strada sbagliata e il mio intervallo Pearson clopper non è corretto. Le mie più umili scuse a @whuber, che lo ha correttamente sottolineato, ma con cui inizialmente non ero d'accordo e ho ignorato.
L'IC che utilizza il metodo Clopper Pearson è molto buono
θ
[Pr(Bi(1,θ)≥X)≥α2]∩[Pr(Bi(1,θ)≤X)≥α2]
X=1Pr(Bi(1,θ)≥1)=θPr(Bi(1,θ)≤1)=1θ≥α21≥α2X=1X=0Pr(Bi(1,θ)≥0)=1Pr(Bi(1,θ)≤0)=1−θ1−θ≥α2θ≤1−α2X=0[0.025,1]X=1[0,0.975]X=0
Pertanto, chi usa l'intervallo di confidenza di Clopper Pearson non verrà mai decapitato. Osservando l'intervallo, è sostanzialmente l'intero spazio dei parametri. Ma l'intervallo CP lo sta facendo dando una copertura del 100% a un intervallo presumibilmente del 95%! Fondamentalmente, i Frequentisti "imbrogliano" dando un intervallo di confidenza del 95% più copertura di quello che gli è stato chiesto di dare (anche se chi non trufferebbe in una situazione del genere? Se fossi in me, darei l'intero [0, 1] intervallo). Se il re chiedesse un esatto IC al 95%, questo metodo frequentista fallirebbe indipendentemente da ciò che è realmente accaduto (forse ne esiste uno migliore?).
Che dire dell'intervallo bayesiano? (in particolare l'intervallo bayesiano di massima designità posteriore (HPD))
(θ|X)∼Beta(1+X,2−X)Pr(θ≥θe|x=1)=1−(θe)2Pr(θ≤θe|x=0)=1−(1−θe)2θe=0.05−−−−√≈0.224X=1θe=1−0.05−−−−√≈0.776X=0(0,0.776)X=0(0.224,1)X=1
11012+1×110≈0
0.1
0.0250.975
Per citare un vero intervallo di confidenza al 95%, quindi per definizione ci dovrebbero essere alcuni casi (cioè almeno uno) dell'intervallo osservato che non contengono il vero valore del parametro . Altrimenti, come si può giustificare il tag 95%? Non sarebbe solo un valido o non valido chiamarlo un intervallo del 90%, 50%, 20% o anche 0%?
Non vedo quanto sia semplicemente soddisfacente affermare che "in realtà significa il 95% o più" senza una limitazione gratuita. Questo perché l'ovvia soluzione matematica è l'intero spazio dei parametri e il problema è banale. supponiamo che io voglia un 50% CI? se limita solo i falsi negativi, l'intero spazio dei parametri è un elemento della configurazione valido utilizzando solo questi criteri.
100%X=0100×1012+9101012+1%>95%X=1
In conclusione, sembra un po 'strano chiedere un intervallo di incertezza, e quindi valutare quell'intervallo usando il valore vero di cui eravamo incerti. Un confronto "più equo", sia per la fiducia che per gli intervalli credibili, per me sembra la verità della dichiarazione di incertezza fornita con l'intervallo .