Qualcuno può spiegare l'idea principale dietro i metodi Hamiltonian Monte Carlo e in quali casi produrrà risultati migliori rispetto ai metodi Markov Chain Monte Carlo?
Qualcuno può spiegare l'idea principale dietro i metodi Hamiltonian Monte Carlo e in quali casi produrrà risultati migliori rispetto ai metodi Markov Chain Monte Carlo?
Risposte:
Credo che la fonte più aggiornata su Hamiltoniano Monte Carlo, le sue applicazioni pratiche e il confronto con altri metodi MCMC sia questo articolo di revisione di Betancourt del 2017 :
L'ultima sfida nella stima delle aspettative probabilistiche è la quantificazione dell'insieme tipico della distribuzione target, un insieme che si concentra vicino a una superficie complessa nello spazio dei parametri. L'Hamiltoniano Monte Carlo genera un'esplorazione coerente di distribuzioni di target fluide sfruttando la geometria dell'insieme tipico. Questa efficace esplorazione offre non solo una migliore efficienza computazionale rispetto ad altri algoritmi Monte Carlo della catena Markov, ma anche maggiori garanzie sulla validità degli stimatori risultanti. Inoltre, un'attenta analisi di questa geometria facilita le strategie di principio per la costruzione automatica di implementazioni ottimali del metodo, consentendo agli utenti di concentrare le proprie competenze nella costruzione di modelli migliori invece di lottare con le frustrazioni del calcolo statistico. Di conseguenza,Stan (Stan Development Team, 2017).
Hamiltonian Monte Carlo ( HMC ), originariamente chiamato Hybrid Monte Carlo, è una forma di Markov Chain Monte Carlo con un termine momentaneo e correzioni.
"Hamiltoniano" si riferisce alla meccanica hamiltoniana.
Il caso d'uso sta esplorando stocasticamente (in modo casuale) dimensioni elevate per l'integrazione numerica su uno spazio di probabilità.
Catena di Markov semplice / vaniglia Monte Carlo (MCMC) utilizza solo l'ultimo stato per determinare lo stato successivo. Ciò significa che è probabile che tu vada avanti come devi tornare indietro nello spazio che hai già esplorato.
MCMC inoltre è probabile che vada alla deriva al di fuori dell'area di interesse primario anche in spazi ad alta dimensione.
Ciò rende MCMC molto inefficiente ai fini dell'integrazione numerica su uno spazio di probabilità multidimensionale.
Aggiungendo un termine momentaneo, HMC rende più efficiente l'esplorazione dello spazio delle probabilità, poiché ora è più probabile che tu faccia progressi in avanti con ogni passaggio del tuo spazio delle probabilità.
HMC utilizza anche le correzioni di Metropolis-Hastings per assicurarsi che rimanga all'interno ed esplori la regione con maggiore probabilità.
Nel scrivere questa risposta, ho trovato questa presentazione su HMC molto illuminante.