Ragionamento e condizionamento frequentista sulle osservazioni (esempio di Wagenmakers et al.)


9

Non sono un esperto di statistica, ma ritengo ci sia disaccordo sul fatto che un'interpretazione "frequente" o "bayesiana" della probabilità sia quella "giusta". Da Wagenmakers et. al p. 183:

Considera una distribuzione uniforme con media e larghezza . Disegnare due valori casualmente da questa distribuzione, etichettare la più piccola e il più grande , e controllare se la media trova tra e . Se questa procedura viene ripetuta molte volte, la media troverà tra e nella metà dei casi. Pertanto, fornisce un intervallo di confidenza del frequentatore del 50% per . Ma supponiamo che per un disegno particolare, eμ1l μ s l μ s l ( s , l ) μ s = 9,8 l = 10,7 0,9 s l s < μ < lSlμSlμSl(S,l)μS=9.8l=10.7. La differenza tra questi valori è e copre il 9/10 dell'intervallo della distribuzione. Quindi, per questi particolari valori di e possiamo essere sicuri al 100% che , anche se l'intervallo di confidenza frequentista vorrebbero far credere si dovrebbe solo essere sicuri al 50%.0.9SlS<μ<l

Ci sono davvero persone che credono che ci sia solo il 50% di fiducia in questo caso o è un uomo di paglia?

Immagino più in generale, il libro sembra dire che i frequentatori non possono esprimere un'affermazione condizionale come "Dato e , con probabilità 1". È vero che il condizionamento implica un ragionamento bayesiano?l = 10,7 s < μ < lS=9.8l=10.7S<μ<l


8
Tutte e tre le risposte attuali sono molto buone. Vorrei solo aggiungere che Wagenmakers sta facendo una discussione di paglia, nel senso che nessuno statistico frequentista raccomanderebbe mai questo intervallo di confidenza - esiste in letteratura solo come esempio di un intervallo di confidenza patologica. Da un punto di vista frequentista, dimostra che la copertura della fiducia da sola non è sufficiente per una buona deduzione. (Sono un bayesiano.)
Ciano

Risposte:


14

Ci sono alcuni imbrogli intricati coinvolti. L'intervallo di confidenza non utilizza l'informazione secondo cui l'intervallo dell'uniforme è 1 ed è quindi non parametrico, mentre l'affermazione fatta sul campione con fa ed è fortemente dipendente dal modello. Sono abbastanza sicuro che si possa migliorare la copertura o la lunghezza (prevista) dell'intervallo di confidenza se si tiene conto di queste informazioni. Per prima cosa, i punti finali della distribuzione sono al massimo distanti da o . Quindi, un intervallo di confidenza al 100% per è .l - s = 0,9 1 - ( L - s ) s l μ ( l - 1 / 2 , s + 1 / 2 )(S,l)l-S=0.91-(l-S)Slμ(l-1/2,S+1/2)

Questo particolare problema rientra nel dominio dell'inferenza per le distribuzioni parzialmente identificate studiate negli ultimi 10-15 anni ampiamente in econometria teorica. La verosimiglianza, e quindi la bayesiana, l'inferenza per la distribuzione uniforme è brutta, poiché costituisce un problema non regolare (il supporto della distribuzione dipende da un parametro sconosciuto).


Dubito che tu possa abbassare la lunghezza prevista al di sotto di per un intervallo di confidenza del 50% su un campione di 2 articoli. 13
Henry,

11

Sono titubante nel rispondere a questa domanda. Questi spati frequentista e bayesiano sono generalmente improduttivi e possono essere cattivi e giovanili. Per quello che vale, Wagenmakers è un po 'un grosso problema, mentre d'altra parte ha dimenticato filosofi cinesi di 3k + anni ...

Tuttavia, direi che l'interpretazione del Frequentista standard di un intervallo di confidenza del 50% non è che dovresti essere sicuro del 50% che il vero valore risieda nell'intervallo o che ci sia una probabilità del 50% che lo faccia. Piuttosto, l'idea è semplicemente che, se lo stesso processo fosse ripetuto indefinitamente, la percentuale di CI che includeva il valore reale converrebbe al 50%. Per ogni singolo intervallo, tuttavia, la probabilità che includa il valore vero è 0 o 1, ma non sai quale .


5

Penso che sia un argomento debole per un caso forte.

può essere un intervallo di confidenza del 50% nel senso definito, ma lo è anche ( 3 l + s - 1(S,l)(3l+S-14,3S+l+14)12n1n+1


{9.8,10.7}50%[10.225,10,275]100%[10.2,10.3]
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.