Teorema del limite centrale per le catene di Markov


10

Il Teorema del limite centrale (CLT) afferma che per indipendenti e identicamente distribuiti (iid) con e , la somma converge in una distribuzione normale come : X1,X2,E[Xi]=0Var(Xi)<n

i=1nXiN(0,n).

Supponiamo invece che formino una catena di Markov a stati finiti con una distribuzione stazionaria con aspettativa 0 e varianza limitata. Esiste una semplice estensione di CLT per questo caso?X1,X2,P

I documenti che ho trovato su CLT per Markov Chains trattano generalmente casi molto più generali. Sarei molto grato per un puntatore al risultato generale pertinente e una spiegazione di come si applica.


1
L'articolo di Lin e Tegmark Critical Behaviour di Deep Dynamics approfondisce le "limitazioni * dei processi e delle analisi di Markov ... disponibili qui ... ai2-s2-pdfs.s3.amazonaws.com/5ba0/…
Mike Hunter

Risposte:


10

La risposta di Alex R. è quasi sufficiente, ma aggiungo qualche dettaglio in più. In Sul teorema del limite centrale della catena di Markov - Galin L. Jones , se guardi il teorema 9, dice:

Se è una catena di Markov ergodica di Harris con distribuzione stazionaria , allora un CLT vale per se è uniformemente ergodico ed .XπfXE[f2]<

Per gli spazi a stati finiti, tutte le catene irriducibili e aperiodiche di Markov sono uniformemente ergodiche. La dimostrazione di ciò comporta un notevole background nella teoria della catena di Markov. Un riferimento buon sarebbe Pagina 32, nella parte inferiore del Teorema 18 qui .

Quindi, la catena Markov CLT sarebbe valida per qualsiasi funzione che ha un secondo momento finito. La forma che assume il CLT è descritta come segue.f

Sia lo stimatore della media temporale di , quindi, come sottolinea Alex R., come , f¯nEπ[f]n

f¯n=1ni=1nf(Xi)a.s.Eπ[f].

La catena di Markov CLT è

n(f¯nEπ[f])dN(0,σ2),

dove

σ2=Varπ(f(X1))Expected term+2k=1Covπ(f(X1),f(X1+k))Term due to Markov chain.

Una derivazione per il termine può essere trovata a pagina 8 e pagina 9 delle note MCMC di Charles Geyer quiσ2


Grazie, è molto chiaro! C'è una facile discussione sul perché le catene di Markov allo stato finito, irriducibili e aperiodiche siano uniformemente ergodiche? (non che non mi fidi di te ^^).
tom4everitt,

@ tom4everitt Sfortunatamente, la definizione di "facile" è soggettiva. Se hai familiarità con le condizioni di deriva e di minorizzazione per le catene di Markov, allora l'argomento è facile. Altrimenti, sarebbe una lunga discussione. Cercherò invece di trovare un riferimento. Potrebbe volerci un po '.
Greenparker,

Sarebbe fantastico. Se non ne trovi, sarebbe comunque utile un paio di frasi che suggeriscano i passaggi principali.
tom4everitt,

@ tom4everitt Aggiunto un riferimento alla risposta. Spero che sia sufficiente.
Greenparker,

@Greenparker Potrei chiederti aiuto per capire come deriva la varianza nella tua risposta. Ho esaminato il riferimento nella tua risposta, ma non ho trovato una derivazione lì. Ho una fonte, MC per MCsist, ma non capisco bene come sia derivata lì. Cioè, come viene derivato il termine ? Grazie! σ2
LeastSquaresWonderer,

7

Il "solito" risultato per Markov Chains è il Teorema Ergodico di Birkhoff, che dice questo

1ni=1nf(Xi)Eπ[f],

dove è la distribuzione stazionaria e soddisfa e la convergenza è quasi certa.f E | f ( X 1 ) | < πfE|f(X1)|<

Sfortunatamente le fluttuazioni di questa convergenza sono generalmente piuttosto difficili. Ciò è dovuto principalmente all'estrema difficoltà di capire i limiti di variazione totali sulla rapidità con cui converge alla distribuzione stazionaria . Esistono casi noti in cui le fluttuazioni sono analoghe al CLT e si possono trovare alcune condizioni sulla deriva che fanno ritenere l'analogia: sul teorema del limite centrale della catena di Markov - Galin L. Jones (vedi teorema 1). πXiπ

Ci sono anche situazioni stupide, ad esempio una catena con due stati, in cui uno sta assorbendo (cioè e In questo caso non ci sono fluttuazioni, e tu ottenere la convergenza a una distribuzione normale degenerata (una costante).P ( 2 1 ) = 0P(12)=1P(21)=0


2
Non penso che stia chiedendo una convergenza quasi sicura. Penso che voglia una sorta di "traduzione" di alcuni dei CLT su spazi generali: probabilmente una spiegazione di cosa significano i presupposti richiesti nel contesto specifico delle catene spaziali a stati finiti
Taylor,

Grazie. Una normale catena Markov a stati finiti soddisferebbe banalmente la condizione di deriva? Sarei anche felice di conoscerlo solo per una catena a due stati, ma per me è tutt'altro che ovvio come dimostrarlo.
tom4everitt,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.