Metodi MCMC: masterizzazione di campioni?

12

Nei metodi MCMC , continuo a leggere sul burn-intempo o sul numero di campioni da "burn". Che cos'è esattamente e perché è necessario?

Aggiornare:

Una volta che MCMC si stabilizza, rimane stabile? In che modo la nozione di burn-intempo è collegata a quella del tempo di miscelazione?

sampling mcmc

— Amelio Vazquez-Reina
fonte

1

La frase " burn-in " non implica "masterizzazione" dei campioni, ma consente al sistema di sistemarsi in modo soddisfacente dal suo "nuovo" stato a uno in cui è adatto all'uso. (I campioni vengono scartati durante l'insediamento, sì, ma la frase non implica "bruciare" in quel senso. È più vicino a "riscaldare il motore" prima di portarlo sulla strada.) Vedi questa risposta per una discussione su a cosa serve.

— Glen_b

(In particolare, il primo paragrafo di tale risposta)

— Glen_b -Reststate Monica

1

@Glen_b, immagino di saperlo, ma mi piace l'immagine mentale dei campioni dubbi che vanno meglio in fumo ....

— Matt Krause

17

Il burn-in ha lo scopo di dare alla catena di Markov il tempo di raggiungere la sua distribuzione di equilibrio, in particolare se è partita da un pessimo punto di partenza. Per "bruciare" una catena, devi semplicemente scartare i primi campioni prima di iniziare a raccogliere punti. $n$

L'idea è che un punto di partenza "cattivo" può sovrastampare regioni che hanno in realtà probabilità molto basse sotto la distribuzione dell'equilibrio prima che si stabilizzi nella distribuzione dell'equilibrio. Se butti via quei punti, i punti che dovrebbero essere improbabili saranno opportunamente rari.

Questa pagina fornisce un bell'esempio, ma sottolinea anche che il burn-in è più un hack / artform che una tecnica di principio. In teoria, potresti semplicemente provare a lungo o trovare un modo per scegliere un punto di partenza decente.

Modifica: il tempo di miscelazione si riferisce al tempo impiegato dalla catena per avvicinarsi al suo stato stazionario, ma spesso è difficile calcolarlo direttamente. Se conoscessi il tempo di miscelazione, avresti semplicemente scartato molti campioni, ma in molti casi non lo fai. Quindi, si sceglie un tempo di burn-in che si spera sia abbastanza grande invece.

Per quanto riguarda la stabilità, dipende. Se la tua catena è convergente, allora ... è convergente. Tuttavia, ci sono anche situazioni in cui la catena sembra essere convergente ma in realtà si "appende" in una parte dello spazio degli stati. Ad esempio, immagina che ci siano diverse modalità, ma ciascuna modalità è scarsamente connessa alle altre. Il campionatore potrebbe impiegare molto tempo a superare questo gap e sembrerà che la catena convergesse fino a quando non fa quel salto.

Esistono sistemi diagnostici per la convergenza, ma molti di loro hanno difficoltà a distinguere la vera convergenza e la pseudo-convergenza. Il capitolo di Charles Geyer (n. 1) nel Manuale di Markov Chain Monte Carlo è piuttosto pessimista su tutto tranne che far funzionare la catena il più a lungo possibile.

— Matt Krause
fonte

Grazie. Ho aggiunto un piccolo aggiornamento al PO con la speranza di chiarire ulteriormente il concetto.

— Amelio Vazquez-Reina

Ho aggiunto un po 'di più; Spero possa aiutare.

— Matt Krause,

6

L'algoritmo Metropolis-Hastings campiona casualmente dalla distribuzione posteriore. In genere, i campioni iniziali non sono completamente validi perché la catena di Markov non si è stabilizzata alla distribuzione stazionaria. La masterizzazione in campioni consente di scartare questi campioni iniziali che non sono ancora fermi.

— Eric Peterson
fonte

1

Grazie - Una volta che la catena Markov si stabilizza, rimane stabile? In che modo ciò si riferiva alla nozione di tempo di miscelazione? È lo stesso?

— Amelio Vazquez-Reina