Un intervallo di confidenza fornisce effettivamente una misura dell'incertezza della stima di un parametro?


12

Stavo leggendo un post sul blog dello statistico William Briggs e la seguente affermazione mi interessava a dir poco.

Cosa ne pensi?

Cos'è un intervallo di confidenza? È ovviamente un'equazione che ti fornirà un intervallo per i tuoi dati. Ha lo scopo di fornire una misura dell'incertezza di una stima dei parametri. Ora, rigorosamente secondo la teoria del frequentista - che possiamo persino supporre sia vera - l'unica cosa che puoi dire sull'IC che hai in mano è che il vero valore del parametro sta al suo interno o che non lo è. Questa è una tautologia, quindi è sempre vera. Pertanto, l'IC non fornisce alcuna misura di incertezza: in effetti, è un esercizio inutile calcolarne uno.

Link: http://wmbriggs.com/post/3169/


3
Senza un riferimento preciso, non c'è, soprattutto, nessun contesto qui. Inoltre, non è possibile ottenere indicazioni sullo stile e le credenziali di William Briggs (a me ignoto). Potrebbe essere che qui qualcuno a cui piace essere provocatorio e oltraggioso. Ci sono, naturalmente, anche qui questioni tecniche e filosofiche profonde e difficili, che sono la domanda, ma è improbabile che ci chieda di discutere una citazione senza sfondo (solo una vista).
Nick Cox,

1
@NickCox Per quanto riguarda l'omissione del contesto rilevante, ho ora modificato il post iniziale.
Cinque del

6
Grazie mille per aver fornito il backup. È solo un commento e non ho la tendenza a estenderlo, ma la mia reazione di tre parole è che l'ultima frase è un'affermazione esagerata . Puoi sperare in risposte molto più complete.
Nick Cox,

1
@NickCox Nessun problema Nick. Tuttavia, apprezzo i tuoi sentimenti in quanto è stato sciatto da parte mia non fare riferimento alla mia domanda.
Cinque del

2
@Nick direi che Briggs è riuscito in uno dei suoi due obiettivi: "I pensieri di oggi sono solo uno schizzo per aiutare a schiarirmi le idee e iniziare una discussione. Significa che probabilmente sarei caduto in preda alla mia stessa lamentela" (che il tuo "vicinato" statistico "è un" pensatore sciatto ").
whuber

Risposte:


24

Si riferisce, piuttosto goffamente, al fatto ben noto che l'analisi del frequentista non modella lo stato delle nostre conoscenze su un parametro sconosciuto con una distribuzione di probabilità, quindi avendo calcolato un intervallo di confidenza (diciamo 95%) (diciamo da 1.2 a 3.4) per un parametro di popolazione (ad esempio la media di una distribuzione gaussiana) da alcuni dati che non è possibile proseguire e affermare che esiste una probabilità del 95% che la media scenda tra 1,2 e 3,4. La probabilità è una o zero: non sai quale. Ma quello che puoi dire, in generale, è che la tua procedura per il calcolo degli intervalli di confidenza al 95% è quella che garantisce che contengano il vero valore del parametro il 95% delle volte. Questo sembra un motivo sufficiente per dire che gli EC riflettono l'incertezza. Come diceva Sir David Cox

Definiamo procedure per la valutazione di prove calibrate dal modo in cui si comporterebbero se fossero usate ripetutamente. In tal senso non differiscono dagli altri strumenti di misura.

Vedi qui e qui per ulteriori spiegazioni.

Altre cose che puoi dire variano in base al metodo particolare che hai usato per calcolare l'intervallo di confidenza; se assicuri che i valori all'interno abbiano una maggiore probabilità, dati i dati, rispetto ai punti esterni, allora puoi dirlo (e spesso è approssimativamente vero per i metodi comunemente usati). Vedi qui per di più.

† Cox (2006), Principles of Statistical Inference , §1.5.2


1
Questo è Sir David Cox, immagino.
Nick Cox,

@NickCox: Lo è davvero.
Scortchi - Ripristina Monica

L'analogia citata da Sir David è corretta? (Non una citazione corretta, ma un'analogia corretta.) Non immagino un termometro che il 95% delle volte segnala la temperatura , ma il 5% delle volte riporta la temperatura al di fuori di - e forse molto al di fuori di tale intervallo? ± ϵ±ϵ±ϵ
Wayne,

1
@Spectrosaurus: i post che ho collegato per approfondire questo aspetto. Alla fine, la popolazione media non è modellata come una variabile casuale; i dati sono, con una distribuzione che dipende da , e l'intervallo di confidenza è una funzione dei dati. definisce un intervallo di confidenza valido con il 95% la copertura, qualsiasi valore potrebbero avere. Quindi se , ...μXμμ(bL(Xμ),bU(Xμ))Pr[bU(Xμ)<μ<bU(Xμ)]=0.95μμ=2
Scortchi - Ripristina Monica

1
... è vero, e se , è vero. Ora sostituendo i valori realizzati di ottiene ad esempio , ovvero se , e se , - che è una sciocchezza. Pr[bU(X2)<2<bU(X2)]=0.95μ=7Pr[bU(X7)<7<bU(X7)]=0.95XμPr[1.2<μ<3.4]=0.95μ=2Pr[1.2<2<3.4]=0.95μ=7Pr[1.2<2<3.4]=0.95
Scortchi - Ripristina Monica

2

Può essere difficile caratterizzare matematicamente l'incertezza, ma la conosco quando la vedo; di solito ha ampi intervalli di confidenza al 95%.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.