Definizione del tempo di autocorrelazione (per dimensioni del campione effettive)

23

Ho trovato due definizioni in letteratura per il tempo di autocorrelazione di una serie temporale debolmente stazionaria:

τ_{un'} = 1 + 2 Σ_{K = 1}^{\infty} ρ_{K} contro τ_{B} = 1 + 2 Σ_{K = 1}^{\infty} | ρ_{K} |

$\tau_a = 1+2\sum_{k=1}^\infty \rho_k \quad \text{versus} \quad \tau_b = 1+2\sum_{k=1}^\infty \left|\rho_k\right|$

dove è l'autocorrelazione al ritardo. $\rho_k = \frac{\text{Cov}[X_t,X_{t+h}]}{\text{Var}[X_t]}$ $k$

Un'applicazione del tempo di autocorrelazione è trovare la "dimensione effettiva del campione": se non hai osservazioni di una serie temporale e conosci il suo tempo di autocorrelazione , puoi far finta di avere $n$ $\tau$

n_{eff} = \frac{n}{τ}

$n_\text{eff} = \frac{n}{\tau}$

campioni indipendenti invece di quelli correlati allo scopo di trovare la media. Stimare dai dati non è banale, ma ci sono alcuni modi per farlo (vedi Thompson 2010 ). $n$ $\tau$

La definizione senza valori assoluti, , sembra più comune in letteratura; ma ammette la possibilità di . Usando R e il pacchetto "coda": $\tau_a$ $\tau_a<1$

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

La funzione "effectSize" in "coda" usa una definizione del tempo di autocorrelazione equivalente a , sopra. Esistono altri pacchetti R là fuori che calcolano la dimensione del campione o il tempo di autocorrelazione effettivi, e tutti quelli che ho provato danno risultati coerenti con questo: che un processo AR (1) con un coefficiente AR negativo ha campioni più efficaci rispetto al correlato serie storiche. Questo sembra strano. $\tau_a$

Ovviamente, ciò non può mai accadere nella definizione del tempo di autocorrelazione. $\tau_b$

Qual è la definizione corretta di tempo di autocorrelazione? C'è qualcosa di sbagliato nella mia comprensione delle dimensioni effettive del campione? Il risultato mostrato sopra sembra che debba essere sbagliato ... cosa sta succedendo? $n_\text{eff} > n$

r time-series correlation

— andrewtinka
fonte

Solo per essere sicuro di non aver frainteso non dovrebbe essere

invece di

?

C o v (X_{t}, X_{t + k})

$Cov(X_t,X_{t+k})$

h

$h$

— sachinruk,

2

Sono interessato alla seconda definizione, ovvero

. Potresti fornire la letteratura in cui l'hai trovata?

τ_{b}

$\tau_b$

— Harry

17

Innanzitutto, la definizione appropriata di "dimensione effettiva del campione" è l'IMO collegata a una domanda piuttosto specifica. Se sono identicamente distribuite con media e varianza 1 empirico medio $X_1, X_2, \ldots$ $\mu$ è uno stimatore imparziale di. Ma per quanto riguarda la sua varianza? Pervariabiliindipendentila varianza è. Per una serie temporale debolmente stazionario, la varianza di è

\hat{μ} = \frac{1}{n} Σ_{K = 1}^{n} X_{K}

$\hat{\mu} = \frac{1}{n} \sum_{k=1}^n X_k$

μ

$\mu$

n^{- 1}

$n^{-1}$

\hat{μ}

$\hat{\mu}$

L'approssimazione è valida per

abbastanza grande. Se definiamo

, la varianza della media empirica per una serie temporale debolmente stazionaria è approssimativamente

, che è la stessa varianza di se non avessimo

campioni indipendenti. Quindi

è una definizione appropriata se chiediamo la varianza della media empirica. Potrebbe essere inappropriato per altri scopi.

\frac{1}{n^{2}} Σ_{K, l = 1}^{n} COV (X_{K}, X_{l}) = \frac{1}{n} (1 + 2 (\frac{n - 1}{n} ρ_{1} + \frac{n - 2}{n} ρ_{2} + ... + \frac{1}{n} ρ_{n - 1})) ≃ \frac{τ_{un'}}{n} .

$\frac{1}{n^2} \sum_{k, l=1}^n \text{cov}(X_k, X_l) = \frac{1}{n}\left(1 + 2\left(\frac{n-1}{n} \rho_1 + \frac{n-2}{n} \rho_2 + \ldots + \frac{1}{n} \rho_{n-1}\right) \right) \simeq \frac{\tau_a}{n}.$

n

$n$

n_{eff} = n / τ_{a}

$n_{\text{eff}} = n/\tau_a$

n_{eff}^{- 1}

$n_{\text{eff}}^{-1}$

n_{eff}

$n_{\text{eff}}$

n_{eff} = n / τ_{a}

$n_{\text{eff}} = n/\tau_a$

Con una correlazione negativa tra le osservazioni è certamente possibile che la varianza possa diventare inferiore a ( ). Questa è una tecnica di riduzione della varianza ben nota nell'integrazione di Monto Carlo: se introduciamo una correlazione negativa tra le variabili anziché la correlazione 0, possiamo ridurre la varianza senza aumentare la dimensione del campione. $n^{-1}$ $n_{\text{eff}} > n$

— NRH
fonte

2

Per chiunque voglia saperne di più sull'uso della correlazione negativa nella simulazione Monte Carlo, prova a cercare "variati antitetici" su Google. Maggiori informazioni nelle note sul corso qui o qui .

— Andrewtinka,

1

vedi http://arxiv.org/pdf/1403.5536v1.pdf

e

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

per dimensioni del campione effettive. Penso che la formulazione alternativa usando il rapporto tra varianza del campione e varianza asintotica della catena di Markov tramite media batch sia uno stimatore più appropriato.

— amico subhadip
fonte

4

Potresti espandere il contenuto di questi link? Allo stato attuale, questo è troppo breve per una risposta secondo i nostri standard!

— kjetil b halvorsen,