Riferendosi a questa discussione: come spiegheresti Markov Chain Monte Carlo (MCMC) a un laico? .
Vedo che è una combinazione di Catene di Markov e Monte Carlo: una catena di Markov viene creata con il posteriore come distribuzione limitante invariante e quindi i disegni di Monte Carlo (dipendenti) sono fatti dalla distribuzione limitante (= nostro posteriore).
Diciamo (so che sto semplificando qui) che dopo passi siamo alla distribuzione limitante (*).Π
Essendo la catena di Markov una sequenza di variabili casuali, ottengo una sequenza , dove è una variabile casuale e è il limite ' 'variabile casuale' 'da cui desideriamo campionare. X i Π
L'MCMC parte da un valore iniziale, ovvero è una variabile casuale con tutta la massa a valore . Se uso lettere maiuscole per variabili casuali e lettere minuscole per la realizzazione di una variabile casuale, allora MCMC mi dà una sequenza . Quindi la lunghezza della catena MCMC è L + n.x 1 x 1 , x 2 , x 3 , ... x L , π 1 , π 2 , π 3 , . . . . π n
[[* Nota: le lettere maiuscole sono variabili casuali (cioè un intero gruppo di risultati) e la piccola sono risultati, ovvero un valore particolare. *]]
Ovviamente, solo il appartiene al mio "posteriore" e per approssimare il "bene" posteriore il valore di dovrebbe essere "abbastanza grande". n
Se riassumo questo, allora ho una catena MCMC di lunghezza , solo sono rilevanti per la mia approssimazione posteriore e dovrebbe essere abbastanza grande. N = L + n π 1 , π 2 , … , π n n
Se includo alcune delle (cioè le realizzazioni prima che venga raggiunta la distribuzione invariante) nel calcolo dell'approssimazione del posteriore, allora sarà '' rumoroso ''.
Conosco la lunghezza della catena MCMC , ma senza la conoscenza di , ovvero il passaggio in cui sono sicuro di campionare dalla distribuzione limitante, non posso essere sicuro di non includere il rumore, né posso assicurati di , la dimensione del mio campione dalla distribuzione limitante, in particolare, non posso essere sicuro che sia "abbastanza grande". L n = N - L
Quindi, per quanto ho capito, questo valore di è di fondamentale importanza per la qualità dell'approssimazione del posteriore (esclusione del rumore e un grande campione da esso) .
Esistono modi per trovare una stima ragionevole per quando applico MCMC?
(*) Penso che, in generale, dipenderà dal valore iniziale .x 1