MCMC con algoritmo Metropolis-Hastings: scelta della proposta


13

Ho bisogno di fare una simulazione per valutare un integrale di una funzione a 3 parametri, diciamo , che ha una formula molto complicata. Viene chiesto di utilizzare il metodo MCMC per calcolarlo e implementare l'algoritmo Metropolis-Hastings per generare i valori distribuiti come f , ed è stato suggerito di utilizzare un normale 3 variato come distribuzione della proposta. Leggendo alcuni esempi a riguardo, ho visto che alcuni usano una normale con parametri fissi N ( μ , σ ) e alcuni usano una media variabile N ( X , σ ) , dove X è l'ultimo valore accettato distribuito secondo fffN(μ,σ)N(X,σ)Xf. Ho dei dubbi su entrambi gli approcci:

1) Qual è il significato della scelta dell'ultimo valore accettato come nuova media della nostra distribuzione di proposte? La mia intuizione dice che dovrebbe garantire che i nostri valori saranno più vicini ai valori distribuiti come e che le possibilità di accettazione sarebbero maggiori. Ma non concentra troppo il nostro campione? È garantito che, se ottengo più campioni, la catena diventerà stazionaria?f

2) Non sceglierei parametri fissi (poiché la è davvero difficile da analizzare) sarebbe davvero difficile e dipendente dal primo campione che dobbiamo scegliere per avviare l'algoritmo? In questo caso, quale sarebbe l'approccio migliore per trovare quale è meglio?f

Uno di questi approcci è migliore dell'altro o questo dipende dal caso?

Spero che i miei dubbi siano chiari e sarei felice se si potesse dare un po 'di letteratura (ho letto alcuni articoli sul tema, ma di più è meglio!)

Grazie in anticipo!

Risposte:


10

1) Potresti pensare a questo metodo come ad un approccio di camminata casuale. Quando la distribuzione della proposta , viene comunemente definita algoritmo di Metropolis. Se σ 2 è troppo piccolo, avrai un alto tasso di accettazione ed esplorerai molto lentamente la distribuzione target. Infatti, se σ 2 è troppo piccolo e la distribuzione è multimodale, il campionatore potrebbe rimanere bloccato in una modalità particolare e non sarà in grado di esplorare completamente la distribuzione target. D'altra parte, se σ 2xxtN(xt,σ2)σ2σ2σ2è troppo grande, il tasso di accettazione sarà troppo basso. Poiché hai tre dimensioni, la distribuzione della tua proposta avrebbe una matrice di covarianza che probabilmente richiederà varianze e covarianze diverse per ogni dimensione. Scegliere un Σ appropriato può essere difficile.ΣΣ

2) Se la distribuzione della tua proposta è sempre , questo è l'algoritmo Metropolis-Hastings indipendente poiché la distribuzione della tua proposta non dipende dal tuo campione attuale. Questo metodo funziona meglio se la distribuzione della tua proposta è una buona approssimazione della distribuzione target da cui desideri campionare. Hai ragione a dire che scegliere una buona approssimazione normale può essere difficile.N(μ,σ2)

Il successo di nessuno dei due metodi dovrebbe dipendere dal valore iniziale del campionatore. Indipendentemente da dove inizi, la catena Markov dovrebbe eventualmente convergere nella distribuzione target. Per verificare la convergenza, è possibile eseguire diverse catene da diversi punti di partenza ed eseguire una diagnostica di convergenza come la diagnostica di convergenza Gelman-Rubin.


N(μ,σ2)N(μ,σ2)

@rhody. L'algoritmo Metropolis non rilascia il condizionamento nella posizione corrente. Il punto è vagare lentamente nello spazio dei parametri con una proposta simmetrica dalla posizione corrente. Utilizzando QUALSIASI proposta simmetrica che dipende dalla posizione corrente e dal calcolo della probabilità di accettazione di Metropolis, alla fine convergerete alla distribuzione target. Per l'algoritmo indipendente Metropolis-Hastings, si desidera che la distribuzione della proposta sia un'approssimazione della distribuzione target e si utilizza un calcolo diverso per la probabilità di accettazione.
jsk,

qN(μ,σ2)q(Y)q(X)XY

xN(x,ε)
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.