MCMC è senza memoria?


18

Sto cercando di capire quali sono le catene di Markov Monte Carlo (MCMC) dalla pagina Wikipedia francese. Dicono "che i metodi Monte Carlo della catena Markov consistono nel generare un vettore solo dai dati vettoriali , quindi è un processo" senza memoria ""xixi1

I metodi di Monte-Carlo per le cattedre di Markov sono coerenti con il generale un vettore unicità alla parte del donatore del video ; c'est donc un processus «sans mémoire»,xixi1

Non capisco perché dicono che gli MCMC sono "senza memoria" per quanto usiamo le informazioni dai dati vettoriali per generare .xi1xi


3
Perché non è necessario "ricordare" nulla del processo tranne l'ultimo stato della catena. Immagino che tu abbia ancora bisogno di un po 'di memoria ma è solo un'informazione.
user2974951

xi1 non è "ricordato"; è l'input esplicito.
Chepner,

Risposte:


28

La caratteristica distintiva di una catena di Markov è che la distribuzione condizionale del suo valore attuale in base ai valori passati dipende solo dal valore precedente . Quindi ogni catena di Markov è "senza memoria" nella misura in cui solo il valore precedente influenza l'attuale probabilità condizionata e tutti gli stati precedenti sono "dimenticati". (Hai ragione nel dire che non è completamente privo di memoria - dopo tutto, la distribuzione condizionale del valore attuale dipende dal valore precedente.) Questo è vero per MCMC e anche per qualsiasi altra catena Markov.


9
Se fai un passo avanti, puoi dire che la distribuzione condizionale dei suoi valori futuri dipende dai valori passati e presenti dipende solo dal valore presente e in tal senso la memoria del passato non è necessaria finché la posizione attuale è nota
Henry,

Tranne che puoi sempre regolare lo spazio degli stati per archiviare qualsiasi quantità finita di informazioni sul passato. Ad esempio, è ancora Markovian a dipendere dai tuoi ultimi dieci stati, poiché puoi semplicemente espandere lo spazio degli stati per includere quelle informazioni nello "stato precedente".
David Richerby,

15

Mentre abbiamo la risposta corretta, vorrei espandere solo un po 'la semantica intuitiva dell'affermazione. Immagina di ridefinire i nostri indici in modo tale da generare il vettore dal vettore . Ora, momento in cui è metaforicamente visto come "il presente", e tutti i vettori provenienti "prima di" sono irrilevanti per il calcolo della prossima uno in futuro.xi+1xiixi

Attraverso questa semplice rinumerazione, diventa "completamente senza memoria" in senso intuitivo - cioè, non importa affatto come il sistema Markov sia diventato nel suo stato attuale . Lo stato presente da solo determina gli stati futuri , senza utilizzare alcuna informazione dagli stati passati ( ).xin

Un punto forse più sottile: viene usata anche la parola "memoria" perché ciò significa anche che non è possibile inferire stati passati dallo stato attuale. Una volta che sei su , non sai cosa è successo "prima" durante . Questo è l'opposto dei sistemi che codificano la conoscenza degli stati passati nello stato presente.xixin


5

Ti svegli. Non hai idea di come sei arrivato dove sei. Ti guardi intorno e prendi una decisione su cosa fare dopo basandoti esclusivamente sulle informazioni che hai a disposizione in quel momento. Questa è essenzialmente la stessa situazione di ciò che sta accadendo in MCMC.

Sta usando le informazioni correnti che può attualmente vedere per prendere una decisione su cosa fare dopo. Invece di pensarlo come capire da (che potrebbe essere ciò che ti sta causando problemi perché stai pensando "hey stiamo guardando nel passato quando guardiamo ) pensa a come capire quale dovrebbe essere basato sulle informazioni correnti per le quali non hai bisogno di 'memoria'. Queste due formulazioni sono equivalenti ma potrebbe aiutarti a pensare alla semantica un po 'meglio.xixi1xi1xi+1xi


2
Chiamiamolo metodo di
postumi di una

@ThePassenger Chiamalo come vuoi. Per favore, passa l'aspirina.
Dason,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.