Il campionamento basato sulla catena Markov è il “migliore” per il campionamento Monte Carlo? Sono disponibili schemi alternativi?


9

Catena di Markov Monte Carlo è un metodo basato sulle catene di Markov che ci consente di ottenere campioni (in un'impostazione Monte Carlo) da distribuzioni non standard da cui non è possibile prelevare campioni direttamente.

La mia domanda è: perché la catena Markov è "all'avanguardia" per il campionamento Monte Carlo. Una domanda alternativa potrebbe essere: ci sono altri modi come le catene Markov che possono essere utilizzate per il campionamento Monte Carlo? So (almeno dalla lettura della letteratura) che l'MCMC ha profonde radici teoriche (in termini di condizioni come (a) periodicità, omogeneità ed equilibrio dettagliato) ma mi chiedo se ci siano modelli / metodi probabilistici "comparabili" per Monte Campionamento Carlo simile alle catene di Markov.

Per favore guidami se ho confuso una parte della domanda (o se sembra del tutto confuso).

Risposte:


11

Non c'è motivo di affermare che il campionamento MCMC sia il "miglior" metodo Monte Carlo! Di solito, è al contrario peggio del mio campionamento, almeno in termini di varianza degli stimatori Monte Carlo risultanti In effetti, mentre questa media converge all'aspettativaEπ[h(X)]quandoπè la distribuzione stazionaria e limitante della catena di Markov(Xt)t, ci sono almeno due inconvenienti nell'uso dei metodi MCMC:

1TΣt=1Th(Xt)
Eπ[h(X)]π(Xt)t
  1. La catena deve "raggiungere la stazionarietà", nel senso che deve dimenticare il suo valore iniziale . In altre parole, t deve essere "abbastanza grande" affinché X t sia distribuito da π . A volte "abbastanza grande" può superare di parecchi ordini di grandezza il budget di calcolo per l'esperimento.X0tXtπ
  2. I valori sono correlati, portando a una varianza asintotica che coinvolge var π ( X ) + 2 t = 1 cov π ( X 0 , X t ) che generalmente supera var π ( X ) e quindi richiede simulazioni più lunghe rispetto a per un campione iid.Xt
    varπ(X)+2Σt=1COVπ(X0,Xt)
    varπ(X)

Detto questo, MCMC è molto utile per gestire le impostazioni in cui il campionamento iid regolare è impossibile o troppo costoso e dove il campionamento di importanza è abbastanza difficile da calibrare, in particolare a causa della dimensione della variabile casuale da simulare.

Tuttavia, i metodi sequenziali Monte Carlo come i filtri antiparticolato possono essere più appropriati nei modelli dinamici, in cui i dati provengono da esplosioni che richiedono attenzione immediata e possono persino svanire (cioè non possono essere memorizzati) dopo un breve periodo.

In conclusione, MCMC è uno strumento molto utile (e molto utilizzato) per gestire impostazioni complesse in cui le soluzioni Monte Carlo regolari falliscono.


8

Esistono diversi modi per generare valori casuali da una distribuzione, McMC è uno di questi, ma molti altri sarebbero anche considerati metodi Monte Carlo (senza la parte della catena Markov).

Il più diretto per il campionamento univariato è generare una variabile casuale uniforme, quindi collegarla alla funzione CDF inversa. Funziona alla grande se hai il CDF inverso, ma è problematico quando il CDF e / o il suo inverso sono difficili da calcolare direttamente.

Per problemi multivariati è possibile generare dati da una copula, quindi utilizzare il metodo CDF inverso sui valori generati per avere un certo livello di correlazione tra le variabili (sebbene specificare i parametri corretti per la copula per ottenere il livello di correlazione desiderato spesso richiede un po 'di tentativi ed errori).

Il campionamento del rifiuto è un altro approccio che può essere utilizzato per generare dati da una distribuzione (univariata o multivariata) in cui non è necessario conoscere il CDF o il suo inverso (e non è nemmeno necessaria la costante normalizzante per la funzione di densità), ma questo può essere altamente inefficiente in alcuni casi impiegando molto tempo.

Se sei interessato a riepiloghi dei dati generati piuttosto che a punti casuali, allora il campionamento di importanza è un'altra opzione.

Il campionamento Gibbs, che è una forma di campionamento McMC, consente di campionare dove non si conosce la forma esatta della distribuzione multivariata, purché si conosca la distribuzione condizionale per ciascuna variabile date le altre.

Ce ne sono anche altri, il che dipende meglio da ciò che sai e non sai e da altri dettagli del problema specifico. McMC è popolare perché funziona bene in molte situazioni e si generalizza in molti casi diversi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.