Qual è la connessione tra regioni credibili e test di ipotesi bayesiana?


38

Nelle statistiche del frequentista, esiste una stretta connessione tra intervalli di confidenza e test. Usando l'inferenza su nella distribuzione come esempio, l' intervallo di confidenza contiene tutti i valori di che non sono rifiutati dal test al livello di significatività .μN(μ,σ2)1α

x¯±tα/2(n1)s/n
μtα

Gli intervalli di confidenza del frequentista sono in questo senso test invertiti. (Per inciso, ciò significa che possiamo interpretare il valore come il valore più piccolo di per il quale il valore null del parametro verrebbe incluso nell'intervallo di confidenza . Trovo che questo possa essere un modo utile per spiega quali sono i valori per le persone che conoscono un po 'di statistiche.)pα1αp

Leggendo le basi teoriche delle decisioni delle regioni credibili bayesiane , ho iniziato a chiedermi se esiste una connessione / equivalenza simile tra regioni credibili e test bayesiani.

  • C'è una connessione generale?
  • Se non esiste una connessione generale, ci sono esempi in cui esiste una connessione?
  • Se non esiste una connessione generale, come possiamo vederlo?

Una domanda correlata di cui mi stavo chiedendo: qualcuno potrebbe indicarmi un documento che considerano il "gold standard" o "esempio canonico" dei test delle ipotesi bayesiane utilizzati su un problema reale, piuttosto che un esempio di giocattolo. Non ho mai veramente capito il test delle ipotesi bayesiane e penso che troverei un buon esempio del suo uso istruttivo.
Patrick Caldon,

2
@PatrickCaldon Dubito che ci sia un "documento d'oro" su questo perché il test delle ipotesi bayesiane è formulato in un quadro teorico-decisionale (quindi è troppo ampio per essere catturato in un singolo documento). Il libro menzionato nella risposta di MånsT fornisce un buon materiale, anche i libri e i discorsi di Berger potrebbero essere interessanti.

Credo che il documento ba.stat.cmu.edu/vol03is01.php possa chiarire la maggior parte della nostra discussione qui.
Carlos AB Pereira,

Grazie, @Carlos! Il collegamento non sembra funzionare in questo momento, ma immagino che porti al tuo documento del 2008 in Bayesian Analysis con Stern e Wechsler. Ho scoperto che una lettura molto interessante!
Martedì

Caro MånsT: l'analisi bayesiana è passata al Progetto Euclide. L'articolo del Prof. Carlos è qui: projecteuclid.org/…
Zen,

Risposte:


19

Sono riuscito a trovare un esempio in cui esiste una connessione. Sembra dipendere fortemente dalla mia scelta della funzione di perdita e dall'uso di ipotesi composite.

Comincio con un esempio generale, a cui segue un semplice caso speciale che coinvolge la distribuzione normale.

Esempio generale

Per un parametro sconosciuto , sia Θ lo spazio dei parametri e considera l'ipotesi θ Θ 0 rispetto all'alternativa θ Θ 1 = Θ Θ 0 .θΘθΘ0θΘ1=ΘΘ0

Lasciate essere una funzione di test, utilizzando la notazione a Xi'an 's The bayesiano scelta (che è una sorta di all'indietro per quello che io almeno sono abituato a), in modo che noi rifiutiamo Θ 0 se φ = 0 e accettare Θ 0 se φ = 1 . Considera la funzione di perdita L ( θ , φ ) = { 0 , se  φ = I Θ 0 ( θ ) a 0 , se  θ ΘφΘ0φ=0Θ0φ=1 Il test di Bayes è quindiφπ(x)=1

L(θ,φ)={0,Se φ=ioΘ0(θ)un'0,Se θΘ0 e φ=0un'1,Se θΘ1 e φ=1.
φπ(X)=1iofP(θΘ0|X)un'1(un'0+un'1)-1.

Prendi e un 1 = 1 - α . L'ipotesi nulla Θ 0 è accettata se P ( θ Θ 0 | x ) 1 - α .un'0=α0.5a1=1αΘ0P(θΘ0|x)1α

Ora, una regione credibile è una regione tale che P ( Θ c | x ) 1 - α . Pertanto, per definizione, se Θ 0 è tale che P ( θ Θ 0 | x ) 1 - α , Θ c può essere una regione credibile solo se P ( Θ 0Θ c | x ) > 0 .ΘcP(Θc|x)1αΘ0P(θΘ0|x)1αΘcP(Θ0Θc|x)>0

Accettiamo l'ipotesi nulla se solo se ogni regione incredibile contiene un sottoinsieme non nullo di Θ 0 .1αΘ0

Un caso speciale più semplice

Per illustrare meglio che tipo di test abbiamo nell'esempio sopra, prendere in considerazione il seguente caso speciale.

Sia con θ N ( 0 , 1 ) . Impostare Θ = R , Θ 0 = ( - , 0 ] e Θ 1 = ( 0 , ) , in modo che desideriamo verificare se θ 0 .xN(θ,1)θN(0,1)Θ=RΘ0=(,0]Θ1=(0,)θ0

I calcoli standard danno doveΦ()è il cdf normale standard.

P(θ0|x)=Φ(x/2),
Φ()

Sia tale che Φ ( z 1 - α ) = 1 - α . Θ 0 è accettato quando - x / z1αΦ(z1α)=1αΘ0 .x/2>z1α

Ciò equivale ad accettare quando Perα=0,05,Θ0viene pertanto respinto quandox>-2,33.x2zα.α=0.05Θ0x>2.33

Se invece usiamo il precedente , Θ 0 viene rifiutato quando x > - 2.33 - ν .θN(ν,1)Θ0x>2.33ν

Commenti

La funzione di perdita di cui sopra, in cui riteniamo che accettare erroneamente l'ipotesi nulla sia peggiore che respingerla in modo errato, a prima vista può sembrare leggermente artificiale. Può tuttavia essere di notevole utilità in situazioni in cui i "falsi negativi" possono essere costosi, ad esempio quando si effettuano controlli per malattie contagiose pericolose o terroristi.

La condizione che tutte le regioni credibili debbano contenere una parte di è in realtà un po 'più forte di quanto speravo: nel caso del frequentatore la corrispondenza è tra un singolo test e un singolo intervallo di confidenza 1 - α e non tra un singolo test e tutti gli intervalli 1 - α .Θ01α1α


2
+1 Vorrei utilizzare la regione di credibilità anziché l' intervallo di credibilità .

1
Grazie @Procrastinator! Ho modificato la risposta e l'ho cambiata in "regione" mentre ero lì. Lavoro principalmente con regioni HPD di posteriori unimodali, quindi tendo a considerare le regioni di confidenza come intervalli. :)
MånsT

12

Michael e Fraijo hanno suggerito che semplicemente verificare se il valore del parametro di interesse fosse contenuto in una regione credibile era l'equivalente bayesiano di invertire gli intervalli di confidenza. All'inizio ero un po 'scettico su questo, dal momento che non era ovvio per me che questa procedura avesse davvero portato a un test bayesiano (nel solito senso).

A quanto pare, lo fa - almeno se si è disposti ad accettare un determinato tipo di funzioni di perdita. Mille grazie a Zen , che ha fornito riferimenti a due articoli che stabiliscono una connessione tra regioni HPD e test di ipotesi:

Proverò a sintetizzarli qui, per riferimento futuro. Analogamente all'esempio della domanda originale, tratterò il caso speciale in cui le ipotesi sono dove Θ è lo spazio dei parametri.

H0:θΘ0={θ0}andH1:θΘ1=ΘΘ0,
Θ

Pereira & Stern hanno proposto un metodo per testare tali ipotesi senza dover mettere le probabilità precedenti su e Θ 1Θ0Θ1 .

Sia la funzione di densità di θ e definisca T ( x ) = { θ : π ( θ | x ) > π ( θ 0 | x ) } .π()θ

T(x)={θ:π(θ|x)>π(θ0|x)}.

Ciò significa che è una regione HPDT(x) , con credibilità .P(θT(x)|x)

Il test Pereira-Stern rifiuta quando P ( θ T ( x ) | x ) è "piccolo" ( < 0,05 , diciamo). Per un posteriore unimodale, ciò significa che θ 0 è lontano dalle code del posteriore, rendendo questo criterio un po 'simile all'utilizzo dei valori p. In altre parole, Θ 0 viene rifiutato al livello del 5 % se e solo se non è contenuto nella regione HPD al 95 % .Θ0P(θT(x)|x)<0.05θ0Θ05 %95 %

Lascia che la funzione di prova sia 1 se Θ 0 è accettato e 0 se Θ 0 viene rifiutato. Madruga et al. proposto la funzione di perdita L ( θ , φ , x ) = { a ( 1 - I ( θ T ( x ) ) , se  φ ( x ) = 0 b + c I ( θ ( T (φ1Θ00Θ0 cona,b,c>0.

L(θ,φ,x)={a(1I(θT(x)),if φ(x)=0b+cI(θ(T(x)),if φ(x)=1,
a,b,c>0

La minimizzazione della perdita attesa porta al test Pereira-Stern in cui viene rifiutato se P ( θ T ( x ) | x ) < ( b + c ) / ( a + c ) .Θ0P(θT(x)|x)<(b+c)/(a+c).

θ0

x

Per ulteriori approfondimenti su questo argomento, consultare un elenco di articoli che citano il Madruga et al. articolo .


Aggiornamento ottobre 2012:

x

qα(θ|x)θP(θqα(θ|x))=α(qα/2(θ|x),q1α/2(θ|x))Θ0x

Θ0={θ0}Θ0Θ1={θ:θ<θ0}Θ1={θ:θ>θ0}

φ=iΘi01

L2(θ,φ)={0,if θΘi and φ=i,i{1,0,1},α/2,if θΘ0 and φ=0,1,if θΘiΘ0 and φ=i,i{1,1},
Θ0θ0

Questa mi sembra una funzione di perdita abbastanza ragionevole. Discuto di questa perdita, della perdita di Madruga-Esteves-Wechsler e dei test usando ulteriormente set credibili nel manoscritto su arXiv.


2
(Lo
segnerò

L:{ParameterSpace}×{Actions}R

@Zen: Sì, certo, l'ho espresso erroneamente. Grazie per la segnalazione. :)
Martedì

3
@ MånsT: (+1) Questa è una risposta interessante. Rispetto moltissimo il fatto che tu abbia scelto di contrassegnarlo come CW in questo caso, ma vorrei che non lo avessi fatto. :-)
cardinale il

8

Ho letto casualmente il tuo documento arXiv prima di arrivare a questa domanda e ho già scritto un post sul blog ( previsto per l'8 ottobre ). Per riassumere, trovo la tua costruzione di interesse teorico, ma penso anche che sia troppo inventato per essere raccomandato, esp. poiché non sembra risolvere l'ipotesi punto-null del problema del test bayesiano, che tradizionalmente richiede di mettere una massa precedente sul valore del parametro punto-null.

φH0:θθ0H0:θ=θ0

H0Θ0={θ0}


1
1α/2α/2φ=0α/2<min(P(Θ-1),P(Θ1))θ0è nell'intervallo credibile. Lo cambierò nel manoscritto arXiv il prima possibile!
Martedì

H0

Θ0

1
H0P(θΘi|x)>α/2

3

È possibile utilizzare un intervallo credibile (o regione HPD) per il test delle ipotesi bayesiane. Non penso sia comune; tuttavia, per essere onesti, non vedo molto né uso in pratica test formali di ipotesi bayesiana. I fattori di Bayes sono usati occasionalmente (e nel "Bayesian Core" di Robert in qualche modo lodati) nel test di ipotesi istituito.


1
Saluti @Fraijo! Potresti forse approfondire un po 'come la tua risposta differisce da quella di Michael Chernick?
Martedì

2
Non penso che l'uso dei fattori di Bayes per verificare l'ipotesi sia "occasionale", vedi ad esempio questo riferimento .

@ MånsT nel suo follow-up il processo descritto da Michael sembra essere un test di Bayes Factor. In sostanza, crei due modelli con priori diversi in base alla tua ipotesi e quindi confronti la probabilità del set di dati in base a tali priori. Il riferimento Procrasinator pubblicato fornisce una rapida rassegna di ciò.
Fraijo,

1
@Procrastinator L'ho detto solo occasionalmente perché nel mio settore vedo poche persone che usano i metodi bayesiani, per non parlare dell'uso dei metodi bayesiani per verificare l'ipotesi. Personalmente utilizzo i fattori Bayes per verificare la sensibilità dei miei modelli rispetto al precedente, che suppongo sia una forma di verifica delle ipotesi.
Fraijo,

1
@ Risposta breve di MånsT: no. Stabilire un intervallo credibile e scoprire se contiene l'ipotesi nulla è l'unico test diretto che è paragonabile al test di ipotesi frequentista. Esistono due problemi con questo metodo: 1) il fatto ovvio che in alcuni casi è possibile trovare più regioni (ad esempio un HPD contro una regione simmetrica) e 2) testare un'ipotesi puntuale (theta = a) è in conflitto con l'ideale bayesiano dei parametri prendere distribuzioni (theta ~ P (theta)).
Fraijo,

1

Una regione credibile è solo una regione in cui l'integrale della densità posteriore sulla regione è una probabilità specificata, ad esempio 0,95. Un modo per formare un test di ipotesi bayesiana è vedere se il valore (i) ipotizzato nullo del (i) parametro (i) ricade nella regione credibile. In questo modo possiamo avere una corrispondenza 1-1 simile tra test di ipotesi e regioni credibili, proprio come fanno i frequentatori con intervalli di confidenza e test di ipotesi. Ma questo non è l'unico modo per fare test di ipotesi.


Questo tipo di test bayesiani ad hoc sono spesso utilizzati nella pratica?
Martedì

1
@MansT Non credo. Penso che di solito i bayesiani mettano in chiaro le probabilità che l'ipotesi nulla sia vera e che quindi si basino sulle probabilità posteriori del costrutto di dati. Se le probabilità posteriori sono pungenti rispetto all'ipotesi nulla, allora viene respinta. Non sono la persona migliore da chiedere, dato che non faccio molto spesso l'inferenza bayesiana.
Michael R. Chernick,

2
Il test descritto da Michael è accreditato a Lindley da Zellner nel suo libro sull'econometria bayesiana.
Zen,

1
Sì, questo tipo di test è certamente nato dalle idee bayesiane , ma non sono sicuro che abbiano solide basi nella teoria delle decisioni bayesiane . In quest'ultima impostazione mi aspetterei che i test derivino da una funzione di perdita, che generalmente comporta una funzione di test.
Martedì


-1

Lasciami dare come l'ho ottenuto leggendo la risposta di Tim .

Si basa sulle viste della tabella con ipotesi (parametro stimato) in colonne e osservazioni nelle righe.

inserisci qui la descrizione dell'immagine

Nella prima tabella, le probabilità di col sono pari a 1, ovvero sono probabilità condizionate, la cui condizione, entrando nell'evento della colonna viene fornita nella riga inferiore, chiamata "precedente". Nell'ultima tabella, le righe allo stesso modo sommano a 1 e nel mezzo ci sono probabilità congiunte, cioè probabilità condizionali che si trovano nella prima e nell'ultima tabella volte la probabilità della condizione, i priori.

Le tabelle eseguono sostanzialmente la trasformazione bayesiana: nella prima tabella si danno pdf delle osservazioni (righe) in ogni colonna, si imposta il precedente per questa ipotesi (sì, la colonna ipotesi è un pdf di osservazioni in base a tale ipotesi), lo si fa poiché ogni colonna e tabella la prende prima nella tabella delle probabilità congiunte e poi nelle probabilità della tua ipotesi, condizionata dalle osservazioni.

Come ho ottenuto dalla risposta di Tim (correggimi se sbaglio), l'approccio Intervallo critico esamina la prima tabella. Cioè, una volta completato l'esperimento, conosciamo la riga della tabella (o testa o croce nel mio esempio, ma potresti fare esperimenti più complessi, come 100 lanci di monete e ottenere una tabella con 2 ^ 100 righe). Il frequentista analizza le sue colonne, che, come ho detto, è una distribuzione di possibili esiti a condizione che l'ipotesi si raffreddi (ad esempio la moneta è giusta nel mio esempio) e rifiuta quelle ipotesi (colonne) che hanno dato un valore di probabilità molto basso a la riga osservata.

Bayesianist regola prima le probabilità, convertendo i col in righe e guardando la tabella 3, trova la riga del risultato osservato. Dal momento che è anche un pdf, passa attraverso la riga dei risultati dell'esperimento e sceglie l'ipotesi con il più alto prob fino a quando la sua tasca di credibilità al 95% è piena. Il resto dell'ipotesi è respinto.

Come ti piace? Sono ancora in fase di apprendimento e la grafica mi sembra utile. Credo di essere sulla buona strada poiché un utente rispettabile dà la stessa immagine, quando analizza la differenza di due approcci . Ho proposto una visione grafica della meccanica della selezione delle ipotesi.

Incoraggio tutti a leggere l'ultima risposta di Keith, ma il mio quadro di meccanica dei test di ipotesi può immediatamente dire che il frequentista non guarda l'altra ipotesi quando verifica quella attuale mentre la considerazione di ipotesi altamente credibili influisce fortemente sulla ricezione / rifiuto di altre ipotesi in bayesiano analisi perché se si dispone di un'unica ipotesi che si verifica il 95% delle volte in base ai dati osservati, si gettano immediatamente tutte le altre ipotesi, indipendentemente dalla misura in cui i dati si adattano al loro interno. Mettiamo da parte l'analisi statistica del potere, che contrappone due ipotesi basate sui loro intervalli di confidenza.

Ma, a quanto pare, ho notato la somiglianza tra due approcci: sembrano collegati attraverso la P(A | B) > P(A) <=> P(B|A) > P(B)proprietà . Fondamentalmente, se esiste una dipendenza tra A e B, verrà visualizzato come correlazione sia nelle tabelle freq che bayesiane. Quindi, facendo un test di ipotesi si correla con l'altro, devono dare gli stessi risultati. Studiare le radici della correlazione, probabilmente ti darà la connessione tra i due. Nella mia domanda ci chiedo davvero perché la differenza è invece della correlazione assoluta?

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.