MCMC; Possiamo essere sicuri di avere un campione "puro" e "abbastanza grande" dal posteriore? Come può funzionare se non lo siamo?


12

Riferendosi a questa discussione: come spiegheresti Markov Chain Monte Carlo (MCMC) a un laico? .

Vedo che è una combinazione di Catene di Markov e Monte Carlo: una catena di Markov viene creata con il posteriore come distribuzione limitante invariante e quindi i disegni di Monte Carlo (dipendenti) sono fatti dalla distribuzione limitante (= nostro posteriore).

Diciamo (so che sto semplificando qui) che dopo passi siamo alla distribuzione limitante (*).ΠLΠ

Essendo la catena di Markov una sequenza di variabili casuali, ottengo una sequenza , dove è una variabile casuale e è il limite ' 'variabile casuale' 'da cui desideriamo campionare. X i ΠX1,X2,,XL,Π,Π,Π,ΠXiΠ

L'MCMC parte da un valore iniziale, ovvero è una variabile casuale con tutta la massa a valore . Se uso lettere maiuscole per variabili casuali e lettere minuscole per la realizzazione di una variabile casuale, allora MCMC mi dà una sequenza . Quindi la lunghezza della catena MCMC è L + n.x 1 x 1 , x 2 , x 3 , ... x L , π 1 , π 2 , π 3 , . . . . π nX1x1x1,x2,x3,xL,π1,π2,π3,....πn

[[* Nota: le lettere maiuscole sono variabili casuali (cioè un intero gruppo di risultati) e la piccola sono risultati, ovvero un valore particolare. *]]x

Ovviamente, solo il appartiene al mio "posteriore" e per approssimare il "bene" posteriore il valore di dovrebbe essere "abbastanza grande". nπin

Se riassumo questo, allora ho una catena MCMC di lunghezza , solo sono rilevanti per la mia approssimazione posteriore e dovrebbe essere abbastanza grande. N = L + n π 1 , π 2 , , π n nx1,x2,x3,xL,π1,π2,π3,....πnN=L+nπ1,π2,,πnn

Se includo alcune delle (cioè le realizzazioni prima che venga raggiunta la distribuzione invariante) nel calcolo dell'approssimazione del posteriore, allora sarà '' rumoroso ''.xi

Conosco la lunghezza della catena MCMC , ma senza la conoscenza di , ovvero il passaggio in cui sono sicuro di campionare dalla distribuzione limitante, non posso essere sicuro di non includere il rumore, né posso assicurati di , la dimensione del mio campione dalla distribuzione limitante, in particolare, non posso essere sicuro che sia "abbastanza grande". L n = N - LN=L+nLn=NL

Quindi, per quanto ho capito, questo valore di è di fondamentale importanza per la qualità dell'approssimazione del posteriore (esclusione del rumore e un grande campione da esso)L .

Esistono modi per trovare una stima ragionevole per quando applico MCMC?L

(*) Penso che, in generale, dipenderà dal valore iniziale .x 1Lx1

Risposte:


6

TL DR; Non è possibile stimare poiché L = . Pertanto, il presupposto semplificativo non potrà mai essere veramente possibile. (Ci sono alcuni casi in cui si trova, ma non nel mondo generale di MCMC). Puoi comunque decidere quale N ridurrà il pregiudizio iniziale.LL=N


In sostanza, la tua domanda si riduce a "come possiamo stimare il tempo di burn-in?". Il burn-in è l'atto di buttare via i campioni iniziali perché la catena di Markov non è convergente. Esistono molti diagnostici MCMC che ti aiutano a stimare il tempo di "burn-in", puoi vederne una recensione qui .

Ci sono due scuole di burn-in; il popolare è usare uno di quei sistemi diagnostici per decidere cosa sia , e gettare via i campioni L , e la seconda scuola attraverso di essa, i primi L campioni non dovrebbero importare, quindi non preoccuparti di loro. Charlie Geyer ha una sproloquio su questo che sono d'accordo con.LLL

Ora passo ai dettagli più tecnici della tua domanda.

LLLL

LL

LNX1,X2,X3,,XNLLθ

θ¯N=1Ni=1NXi.

NL

Nθ

(θ¯Nθ)N

N(θ¯Nθ)dNp(0,Σ),

θRpΣ

Σ/N


LΣ/nθ^N

Σ/Nθ¯N

X1πg¯n

X1ππ
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.