Stima della camminata casuale con AR (1)


10

Quando valuto una camminata casuale con un AR (1), il coefficiente è molto vicino a 1 ma sempre inferiore.

Qual è la ragione matematica per cui il coefficiente non è maggiore di uno?


Ho provato con Matlab toolbox e anche con il mio script su arima (dove i coefficienti sono limitati a [-10,10] e il risultato è lo stesso). Provo con un semplice OLS e il risultato è lo stesso.
Marco,

La stima è distorta verso il basso, dobbiamo leggere Dickey e Fuller.
Marco,

Risposte:


12

Stimiamo da OLS il modello

Xt=ρXt-1+ut,E(ut|{Xt-1,Xt-2,...})=0,X0=0

Per un campione di dimensione T, lo stimatore è

ρ^=Σt=1TXtXt-1Σt=1TXt-12=ρ+Σt=1TutXt-1Σt=1TXt-12

Se il vero meccanismo di generazione dei dati è una passeggiata casuale pura, allora eρ=1

Xt=Xt-1+utXt=Σio=1tuio

La distribuzione campionaria della OLS stimatore, o equivalentemente, la distribuzione campionaria di ρ - 1 , non è simmetrica intorno allo zero, ma piuttosto è inclinata a sinistra dello zero, con 68 % dei valori ottenuti (cioè massa di probabilità) essere negativo, e così abbiamo ottenere più spesso di quanto non ρ < 1 . Ecco una distribuzione di frequenza relativaρ^-168ρ^<1

inserisci qui la descrizione dell'immagine

Significare:-0.0017773Mediano:-0.00085984Minimo: -0.042875Massimo: 0.0052173Deviazione standard: 0.0031625asimmetria: -2,2568Ex. curtosi: 8,3017

Questa è talvolta chiamata distribuzione "Dickey-Fuller", poiché è la base per i valori critici utilizzati per eseguire i test Unit-Root con lo stesso nome.

Non ricordo di aver visto un tentativo di fornire intuizione per la forma della distribuzione campionaria. Stiamo esaminando la distribuzione campionaria della variabile casuale

ρ^-1=(Σt=1TutXt-1)(1Σt=1TXt-12)

utρ^-1ρ^-1

T=5

Se sommiamo le Normative di prodotto indipendenti otteniamo una distribuzione che rimane simmetrica intorno allo zero. Per esempio:

inserisci qui la descrizione dell'immagine

Ma se sommiamo le Normative di prodotto non indipendenti come nel nostro caso otteniamo

inserisci qui la descrizione dell'immagine

che è inclinato a destra ma con più massa di probabilità assegnata ai valori negativi. E la massa sembra essere spinta ancora di più a sinistra se aumentiamo la dimensione del campione e aggiungiamo elementi più correlati alla somma.

Il reciproco della somma dei Gamma non indipendenti è una variabile casuale non negativa con inclinazione positiva.

ρ^-1


Caspita, bella analisi! Potresti indicare quale delle ipotesi OLS standard è stata violata qui?
Richard Hardy,

@RichardHardy Grazie. Tornerò più tardi per rispondere al tuo commento.
Alecos Papadopoulos,

Sono ancora curioso delle ipotesi OLS ... Grazie in anticipo!
Richard Hardy,

Xt+1=αXt+εXt+1-Xt

ρ^<1ρ^-1

6

Questa non è davvero una risposta, ma è troppo lunga per un commento, quindi la posterò comunque.

Sono stato in grado di ottenere un coefficiente maggiore di 1 due volte su cento per una dimensione del campione di 100 (usando "R"):

N=100                   # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~y[-T])    # regress y on its own first lag, with intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

Le realizzazioni 84 e 95 hanno un coefficiente superiore a 1, quindi non sono sempre inferiori a 1. Tuttavia, la tendenza è chiaramente quella di avere una stima distorta verso il basso. Le domande rimangono, perché ?

Modifica: le regressioni precedenti includevano un termine di intercettazione che non sembra appartenere al modello. Una volta rimossa l'intercettazione, ottengo molte più stime sopra 1 (3158 su 10000) - ma è ancora chiaramente inferiore al 50% di tutti i casi:

N=10000                 # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

esattamente, non "sempre" minore ma nella maggior parte dei casi. È ovviamente un risultato spurio. perché la ragione?
Marco,

2
XtXt-1
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.