Esempi di quando l'intervallo di confidenza e l'intervallo credibile coincidono


11

Nell'articolo di Wikipedia sull'intervallo credibile , si dice:

Nel caso di un singolo parametro e dati che possono essere riassunti in una singola statistica sufficiente, si può dimostrare che l'intervallo credibile e l'intervallo di confidenza coincideranno se il parametro sconosciuto è un parametro di posizione (ovvero la funzione di probabilità diretta ha la forma Pr (x | μ) = f (x - μ)), con un precedente che è una distribuzione piatta uniforme; [5] e anche se il parametro sconosciuto è un parametro di scala (ovvero la funzione di probabilità diretta ha la forma Pr (x | s) = f (x / s)), con un precedente di Jeffreys [5] - quest'ultimo seguito perché prendere il logaritmo di un tale parametro di scala lo trasforma in un parametro di posizione con una distribuzione uniforme. Ma questi sono casi distintamente speciali (anche se importanti); in generale non si può fare una simile equivalenza ".

Le persone potrebbero fornire esempi specifici di questo? Quando l'IC al 95% corrisponde effettivamente alla "probabilità del 95%", quindi "violando" la definizione generale di CI?

Risposte:


13

distribuzione normale:

Prendi una distribuzione normale con varianza nota. Possiamo considerare questa varianza come 1 senza perdere la generalità (semplicemente dividendo ogni osservazione per la radice quadrata della varianza). Questo ha distribuzione campionaria:

p(X1...XN|μ)=(2π)-N2exp(-12Σio=1N(Xio-μ)2)=UNexp(-N2(X¯-μ)2)

Dove è una costante che dipende solo dai dati. Ciò dimostra che la media del campione è una statistica sufficiente per la media della popolazione. Se usiamo un'uniforme prima, la distribuzione posteriore per μ sarà:UNμ

(μ|X1...XN)Normal(X¯,1N)(N(μ-X¯)|X1...XN)~Normun'l(0,1)

Quindi un intervallo credibile avrà la forma:1-α

(X¯+1NLα,X¯+1NUα)

Dove e U α sono scelti in modo tale che una normale variabile casuale normale Z soddisfi:LαUαZ

Pr(Lα<Z<Uα)=1-α

Ora possiamo partire da questa "quantità fondamentale" per costruire un intervallo di confidenza. La distribuzione campionaria di per μ fissoè una distribuzione normale standard, quindi possiamo sostituirla con la probabilità sopra:N(μ-X¯)μ

Pr(Lα<N(μ-X¯)<Uα)=1-α

Quindi riorganizzare per risolvere per e l'intervallo di confidenza sarà lo stesso dell'intervallo credibile.μ

Parametri di scala:

Per i parametri di scala, i pdf hanno il formato . Possiamo prendere(Xi|s)Uniform(0,s), che corrisponde af(t)=1. La distribuzione congiunta del campionamento è:p(Xio|S)=1Sf(XioS)(Xio|S)~Unioform(0,S)f(t)=1

p(X1...XN|S)=S-N0<X1...XN<S

Da cui troviamo che la statistica sufficiente è uguale a (il massimo delle osservazioni). Ora troviamo la sua distribuzione di campionamento:Xmun'X

Pr(Xmun'X<y|S)=Pr(X1<y,X2<y...XN<y|S)=(yS)N

y=qSQ=S-1Xmun'XPr(Q<q)=qNBetun'(N,1)Lα,Uα

Pr(Lα<Q<Uα)=1-α=UαN-LαN

E sostituiamo la quantità fondamentale:

Pr(Lα<S-1Xmun'X<Uα)=1-α=Pr(Xmun'XLα-1>S>Xmun'XUα-1)

E c'è il nostro intervallo di confidenza. Per la soluzione bayesiana con jeffreys prima abbiamo:

p(S|X1...XN)=S-N-1Xmun'Xr-N-1dr=N(Xmun'X)NS-N-1
Pr(S>t|X1...XN)=N(Xmun'X)NtS-N-1dS=(Xmun'Xt)N

Ora inseriamo l'intervallo di confidenza e calcoliamo la sua credibilità

Pr(Xmun'XLα-1>S>Xmun'XUα-1|X1...XN)=(Xmun'XXmun'XUα-1)N-(Xmun'XXmun'XLα-1)N

=UαN-LαN=Pr(Lα<Q<Uα)

1-α


Un capolavoro, grazie! Speravo che potesse esserci una risposta del tipo "quando si calcola la media di un campione da una distribuzione normale, l'IC 95% è in realtà anche l'intervallo credibile del 95%" o qualcosa di simile. (Sto solo inventando questa presunta risposta, non ho idea di esempi specifici.)
Wayne,

Credo che un intervallo di previsione / tolleranza del 95% frequente corrisponda a un intervallo di previsione bayesiano con regressione OLS ed errori normali. Sembra così quando metto a confronto la risposta di predict.lm con una risposta simulata, comunque. È vero?
Wayne,

Y=α+βXα,βσ

Grazie mille! Ho cercato di spiegare un elemento della configurazione per una regressione che ho fatto in termini di intervallo di confidenza, e semplicemente non si collega a un pubblico laico, che si aspetta un intervallo credibile. Rende la vita molto più facile per me ... anche se forse è un male per il mondo statistico generale, poiché rafforzerà l'incomprensione del profano nei confronti di CI.
Wayne,

@Wayne - la situazione è un po 'più generale delle semplici famiglie in scala di posizione. Di solito un elemento della configurazione sarà equivalente all'intervallo credibile, se si basa su una "statistica sufficiente" (come erano questi due) dove esiste. Se non esiste una statistica sufficiente, allora CI deve condizionare su quelle che vengono chiamate "statistiche accessorie" per avere un'interpretazione credibile dell'intervallo.
Probislogic,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.