MCMC adattivo può essere attendibile?


20

Sto leggendo su MCMC adattivo (vedi ad esempio, capitolo 4 del manuale di Markov Chain Monte Carlo , ed. Brooks et al., 2011; e anche Andrieu & Thoms, 2008 ).

Il risultato principale di Roberts e Rosenthal (2007) è che se lo schema di adattamento soddisfa la condizione di adattamento in via di estinzione (più qualche altro tecnicismo), MCMC adattivo è ergodico sotto qualsiasi schema. Ad esempio, l'adattamento evanescente può essere facilmente ottenuto adattando l'operatore di transizione all'iterazione con probabilità , con .np(n)limnp(n)=0

Questo risultato è (a posteriori) intuitivo, asintoticamente. Poiché la quantità di adattamento tende a zero, alla fine non confonderà con l'ergodicità. La mia preoccupazione è cosa succede con il tempo finito .

  • Come facciamo a sapere che l'adattamento non fa confusione con l'ergodicità in un dato momento finito e che un campionatore sta campionando dalla distribuzione corretta? Se ha senso, quanto burn-in si dovrebbe fare per garantire che l'adattamento precoce non dia tensione alle catene?

  • I professionisti del settore si fidano dell'MCMC adattivo? Il motivo che sto chiedendo è perché ho visto molti metodi recenti che cercano di integrare l'adattamento in altri modi più complessi che sono noti per rispettare l'ergodicità, come i metodi di rigenerazione o di ensemble (vale a dire, è legittimo scegliere una transizione operatore che dipende dallo stato di altre catene parallele). In alternativa, l'adattamento viene eseguito solo durante il burn-in, come in Stan , ma non in fase di esecuzione. Tutti questi sforzi mi suggeriscono che la MCMC adattativa secondo Roberts e Rosenthal (che sarebbe incredibilmente semplice da implementare) non è considerata affidabile; ma forse ci sono altri motivi.

  • Che dire di implementazioni specifiche, come Metropolis-Hastings adattivo ( Haario et al. 2001 )?


Riferimenti


1
+1 ma ci sono garanzie a tempo finito anche per MCMC non adattativo?
Juho Kokkala

2
@JuhoKokkala: probabilmente no, ma sembra che con MCMC adattivo si stia aggiungendo un ulteriore strato di possibili modalità di fallimento, che sono meno comprese e più difficili da controllare rispetto ai problemi standard di convergenza (che sono già abbastanza difficili da diagnosticare di per sé). Almeno, questa è la mia comprensione del perché i praticanti (io, per esempio) ne sarei diffidente.
lacerbi,

1
Penso che l'adattamento durante la masterizzazione sia il modo migliore per gestire l'adattamento. Ovviamente se hai alcune aree del tuo posteriore che richiedono una messa a punto diversa rispetto ad altre avrai problemi, ma se è così, se esegui MCMC completamente adattivo non ti sarà permesso di adattarti molto a causa delle condizioni di fuga comunque. .
sega_sai

Risposte:


2

Come facciamo a sapere che l'adattamento non fa confusione con l'ergodicità in un dato momento finito e che un campionatore sta campionando dalla distribuzione corretta? Se ha senso, quanto burn-in si dovrebbe fare per garantire che l'adattamento precoce non dia tensione alle catene?

Ergodicità e pregiudizio riguardano le proprietà asintotiche della catena di Markov, non dicono nulla sul comportamento e sulla distribuzione della catena di Markov at a given finite time. L'adattività non ha nulla a che fare con questo problema, qualsiasi algoritmo MCMC può produrre simulazioni lontane dall'obiettivo at a given finite time.


1
(+1) Grazie per il chiarimento. Sì, capisco che gli algoritmi MCMC non hanno garanzie at a given finite time. Tuttavia, in pratica li usiamo come se fornissero una buona / ragionevole approssimazione della distribuzione target in un dato momento finito, anche se nella maggior parte dei casi non ci sono garanzie teoriche (AFAIK solo alcuni casi sono compresi matematicamente). Forse dovrei dire "incasinare il tempo di miscelazione "? È più vicino a ciò che intendevo. Se hai suggerimenti su come correggere la lingua, faccelo sapere.
Lacerbi,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.