Posso modificare la distribuzione della proposta in MH MCMC a caso senza influire sulla Markovianity?


14

Passeggiata casuale Metropolis-Hasitings con proposta simmetrica

ha la proprietà che la probabilità di accettazioneq(X|y)=g(|y-X|)

P(un'ccept y)=min{1,f(y)/f(X)}

non dipende dalla proposta .g()

Ciò significa che posso cambiare in funzione delle precedenti prestazioni della catena, senza influire sulla markovianità della catena?g()

Di particolare interesse per me è l'adeguamento del ridimensionamento della proposta normale in funzione del tasso di accettazione.

Gradirei anche molto se qualcuno potesse indicare gli algoritmi di adattamento utilizzati nella pratica per questo tipo di problema.

Grazie molto.

[modifica: a partire dai riferimenti forniti da robertsy e wok ho trovato i seguenti riferimenti sugli algoritmi adattativi MH:

Andrieu, Christophe ed Éric Moulines. 2006.
Sulle proprietà di ergodicità di alcuni algoritmi adattativi MCMC. Gli annali della probabilità applicata 16, n. 3: 1462-1505. http://www.jstor.org/stable/25442804 .

Andrieu, Christophe e Johannes Thoms.
2008. Un tutorial su MCMC adattivo. Statistica e informatica 18, n. 4 (12): 343-373. doi: 10.1007 / s11222-008-9110-y. http://www.springerlink.com/content/979087678366r78v/ .

Atchadé, Y., G. Fort, E. Moulines e P. Priouret. 2009.
Catena adattiva di Markov Monte Carlo: teoria e metodi. Preprint.

Atchadé, Yves. 2010.
Limitare i teoremi per alcuni algoritmi MCMC adattativi con kernel subgeometrici. Bernoulli 16, n. 1 (febbraio): 116-154. DOI: 10,3150 / 09-BEJ199. http://projecteuclid.org/DPubS?verb=Display&version=1.0&service=UI&handle=euclid.bj/1265984706&page=record .

Cappé, O., S. J Godsill ed E. Moulines. 2007.
Una panoramica dei metodi esistenti e dei recenti progressi nel sequenziale Monte Carlo. Atti dell'IEEE 95, n. 5: 899-924.

Giordani, Paolo. 2010.
Metropolis indipendente adattabile - Hastings mediante stima rapida di miscele di normali. Giornale di statistica computazionale e grafica 19, n. 2 (6): 243-259. doi: 10,1198 / jcgs.2009.07174. http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.07174 .

Latuszynski, Krzysztof, Gareth O Roberts e Jeffrey S Rosenthal. 2011.
Campionatori adattivi di Gibbs e relativi metodi MCMC. 1101.5838 (30 gennaio). http://arxiv.org/abs/1101.5838 .

Pasarica, C. e A. Gelman. 2009.
Ridimensionamento adattivo dell'algoritmo Metropolis utilizzando la distanza saltata al quadrato prevista. Statistica Sinica.

Roberts, Gareth O. 2009.
Esempi di MCMC adattivo. Giornale di statistica computazionale e grafica 18, n. 2 (6): 349-367. doi: 10,1198 / jcgs.2009.06134. http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.06134 .

]


Come mai non hai +100 di bonus dal tuo record SO?

@mbq, probabilmente perché ho creato questo account molto tempo fa, quando avevo 0 anche su OS ... peccato, 100 su CW sembra un grosso problema, dal momento che devi essere un vero tipo per rispondere alle cose qui :)
VitoshKa

Puoi ottenere il bonus cancellando tutte le associazioni e quindi associando nuovamente gli account.
Wok,

Risposte:


7

Penso che questo articolo di Heikki Haario et al. ti darà la risposta di cui hai bisogno. La markovianità della catena è influenzata dall'adattamento della densità della proposta, perché quindi un nuovo valore proposto dipende non solo da quello precedente ma da tutta la catena. Ma sembra che la sequenza abbia ancora le buone proprietà se si presta molta attenzione.


grazie robertsy, per un buon riferimento. in effetti il ​​processo non è markov. Anche se la probabilità di accettazione è indipendente dal passato, il kernel di transizione del processo è una funzione della densità della proposta e quindi dipende da tutta la catena.
VitoshKa,

3

È possibile migliorare il tasso di accettazione utilizzando il rifiuto ritardato come descritto in Tierney, Mira (1999) . Si basa su una seconda funzione di proposta e una seconda probabilità di accettazione , che garantisce che la catena di Markov sia ancora reversibile con la stessa distribuzione invariante: bisogna essere cauti poiché " è facile costruire metodi adattivi che potrebbero sembrare funzionare ma in realtà campione dalla distribuzione errata ".


3

Gli approcci suggeriti dagli utenti wok e robertsy coprono gli esempi più citati di ciò che stai cercando di cui sono a conoscenza. Solo per espandere queste risposte, Haario e Mira hanno scritto un documento nel 2006 che combina i due approcci, un approccio che chiamano DRAM (ritardato rifiuto adattivo Metropolis) .

Andrieu ha una buona trattazione di vari approcci adattativi MCMC (pdf) che copre Haario 2001 ma discute anche di varie alternative che sono state proposte negli ultimi anni.


1

Questo è un po 'una spina spudorata di una mia pubblicazione, ma facciamo esattamente questo in questo lavoro ( arxiv ). Tra le altre cose, proponiamo di adattare la varianza della distribuzione esponenziale per migliorare l'accettazione (fase S3.2 in algoritmo nel documento).

f1

Non utilizziamo informazioni sul tasso di accettazione, ma otteniamo un'accettazione indipendente dalla quantità a cui siamo interessati (equivalente all'energia di un sistema di spin, in basso a destra nella Fig. 4).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.