Il burn-in ha lo scopo di dare alla catena di Markov il tempo di raggiungere la sua distribuzione di equilibrio, in particolare se è partita da un pessimo punto di partenza. Per "bruciare" una catena, devi semplicemente scartare i primi campioni prima di iniziare a raccogliere punti.n
L'idea è che un punto di partenza "cattivo" può sovrastampare regioni che hanno in realtà probabilità molto basse sotto la distribuzione dell'equilibrio prima che si stabilizzi nella distribuzione dell'equilibrio. Se butti via quei punti, i punti che dovrebbero essere improbabili saranno opportunamente rari.
Questa pagina fornisce un bell'esempio, ma sottolinea anche che il burn-in è più un hack / artform che una tecnica di principio. In teoria, potresti semplicemente provare a lungo o trovare un modo per scegliere un punto di partenza decente.
Modifica: il tempo di miscelazione si riferisce al tempo impiegato dalla catena per avvicinarsi al suo stato stazionario, ma spesso è difficile calcolarlo direttamente. Se conoscessi il tempo di miscelazione, avresti semplicemente scartato molti campioni, ma in molti casi non lo fai. Quindi, si sceglie un tempo di burn-in che si spera sia abbastanza grande invece.
Per quanto riguarda la stabilità, dipende. Se la tua catena è convergente, allora ... è convergente. Tuttavia, ci sono anche situazioni in cui la catena sembra essere convergente ma in realtà si "appende" in una parte dello spazio degli stati. Ad esempio, immagina che ci siano diverse modalità, ma ciascuna modalità è scarsamente connessa alle altre. Il campionatore potrebbe impiegare molto tempo a superare questo gap e sembrerà che la catena convergesse fino a quando non fa quel salto.
Esistono sistemi diagnostici per la convergenza, ma molti di loro hanno difficoltà a distinguere la vera convergenza e la pseudo-convergenza. Il capitolo di Charles Geyer (n. 1) nel Manuale di Markov Chain Monte Carlo è piuttosto pessimista su tutto tranne che far funzionare la catena il più a lungo possibile.