Comprensione del k lag nel test Dickey Fuller potenziato di R.


15

Ho giocato con alcuni test di root delle unità in R e non sono del tutto sicuro su cosa fare del parametro k lag. Ho usato il test potenziato Dickey Fuller e il test Philipps Perron dal pacchetto tseries . Ovviamente il parametro predefinito (per ) dipende solo dalla lunghezza della serie. Se scelgo valori diversi ottengo risultati piuttosto diversi. rifiutando il null:Kadf.testK

Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary 
# 103^(1/3)=k=4 


Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0

Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6

più il risultato del test PP:

Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary 

Osservando i dati, ritengo che i dati sottostanti non siano fissi, ma non considero questi risultati un backup efficace, in particolare poiché non capisco il ruolo del parametro . Se guardo a decomporre / stl vedo che la tendenza ha un forte impatto rispetto al solo piccolo contributo dal resto o dalle variazioni stagionali. La mia serie è di frequenza trimestrale.K

Qualche suggerimento?


3
questo libro dovrebbe rispondere a tutte le tue domande.
mpiktas,

1
Grazie! Adoro la serie Springer useR, ma non la conoscevo ...
hans0l0

hmm, iiuc questi test solo se phi = 1, non se phi> 1. Ma comunque l'uscita R dice che l'alternativa è: stazionarietà. Quindi controllano anche phi> 1? Ovviamente sarebbe anche non stazionario.
hans0l0

Risposte:


5

È passato un po 'di tempo da quando ho esaminato i test ADF, tuttavia ricordo almeno due versioni del test adf.

http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html

http://cran.r-project.org/web/packages/fUnitRoots/

Il pacchetto fUnitRoots ha una funzione chiamata adfTest (). Penso che il problema "tendenza" sia gestito in modo diverso in quei pacchetti.

Modifica ------ Dalla pagina 14 del seguente link, c'erano 4 versioni (uroot fuori produzione) del test adf:

http://math.uncc.edu/~zcai/FinTS.pdf

Un altro link. Leggi la sezione 6.3 nel seguente link. Fa un lavoro molto più bello di quello che potrei fare nello spiegare il termine di ritardo:

http://www.yats.com/doc/cointegration-en.html

Inoltre, starei attento a qualsiasi modello stagionale. A meno che tu non sia sicuro che ci sia un po 'di stagionalità presente, eviterei di usare termini stagionali. Perché? Tutto può essere suddiviso in termini stagionali, anche se non lo è. Ecco due esempi:

#First example: White noise
x <- rnorm(200)

#Use stl() to separate the trend and seasonal term
x.ts <- ts(x, freq=4) 
x.stl <- stl(x.ts, s.window = "periodic")
plot(x.stl)

#Use decompose() to separate the trend and seasonal term
x.dec <- decompose(x.ts)
plot(x.dec)

#===========================================

#Second example, MA process
x1 <- cumsum(x)

#Use stl() to separate the trend and seasonal term
x1.ts <- ts(x1, freq=4)
x1.stl <- stl(x1.ts, s.window = "periodic")
plot(x1.stl)

#Use decompose() to separate the trend and seasonal term
x1.dec <- decompose(x1.ts)
plot(x1.dec)

Il grafico seguente è tratto dall'istruzione plot (x.stl) sopra. stl () ha trovato un piccolo termine stagionale nel rumore bianco. Potresti dire che il termine è così piccolo che in realtà non è un problema. Il problema è che, in dati reali, non sai se quel termine è un problema o no. Nell'esempio seguente, notare che la serie di dati di tendenza ha segmenti in cui assomiglia a una versione filtrata dei dati non elaborati e altri segmenti in cui potrebbero essere considerati significativamente diversi dai dati non elaborati.

inserisci qui la descrizione dell'immagine


1

Il parametro k è un insieme di ritardi aggiunti per affrontare la correlazione seriale. La A nell'ADF indica che il test è aumentato dall'aggiunta di ritardi. La selezione del numero di ritardi nell'ADF può essere effettuata in vari modi. Un modo comune è iniziare con un gran numero di ritardi selezionati a priori e ridurre il numero di ritardi in sequenza fino a quando il ritardo più lungo è statisticamente significativo.

È possibile verificare la correlazione seriale nei residui dopo aver applicato i ritardi nell'ADF.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.