Confusione con il test di Dickey Fuller aumentato


16

Sto lavorando sui set di dati electricitydisponibili nel pacchetto di R TSA. Il mio obiettivo è scoprire se un arimamodello sarà appropriato per questi dati e alla fine adattarlo. Quindi ho proceduto come segue:

1 °: tracciare le serie temporali risultanti se il seguente grafico: ts plot1

2 °: volevo prendere il registro electricityper stabilizzare la varianza e successivamente differenziare le serie come appropriato, ma poco prima di farlo, ho verificato la stazionarietà sul set di dati originale che utilizza il adftest (Augmented Dickey Fuller) e sorprendentemente, è risultato come segue:

Codice e risultati:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

Bene, secondo la nozione di serie temporale del mio principiante, suppongo significhi che i dati sono stazionari (piccolo valore p, rigetta l'ipotesi nulla di non stazionarietà). Ma guardando la trama ts, non trovo alcun modo che questo possa essere fermo. Qualcuno ha una spiegazione valida per questo?


5
L'ADF esegue solo test per unità radice fisse, questa potrebbe essere una tendenza stazionaria. Quindi dovresti usare il test KPSS, vedi stats.stackexchange.com/questions/30569/… In generale, c'è una differenza tra i modelli DS (differenza stazionaria) e TS (tendenza stazionaria). KPSS è il test migliore per distinguere tra quei modelli, vedi il link per maggiori dettagli.
Stat Tistician,

3
Sembra che la serie abbia stagionali e tendenze. Integrare nel test ADF una tendenza deterministica + manichini stagionali ed eseguire il test. Controllare anche i residui autocorrelati.
Pantera,

Risposte:


12

Dato che prendi il valore predefinito di k in adf.test, che in questo caso è 7, stai fondamentalmente testando se il set di informazioni degli ultimi 7 mesi aiuta a spiegareXt-Xt-1. L'utilizzo dell'elettricità ha una forte stagionalità, come mostra la trama, ed è probabile che sia ciclico oltre un periodo di 7 mesi. Se si imposta k = 12 e si esegue nuovamente il test, il valore nullo dell'unità radice non può essere rifiutato,

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary

2

Supponendo che "adf.test" provenga realmente dal pacchetto "tseries" (direttamente o indirettamente), la ragione sarebbe che includa automaticamente una tendenza temporale lineare. Dal documento tseries (versione 0.10-35): "Viene utilizzata l'equazione di regressione generale che incorpora una tendenza costante e una tendenza [...]" Quindi il risultato del test indica effettivamente la stazionarietà della tendenza (che nonostante il nome non sia stazionario).

Concordo anche con Pantera che gli effetti stagionali potrebbero distorcere il risultato. La serie potrebbe in realtà essere una tendenza temporale + stagionali deterministici + processo radicale dell'unità stocastica, ma il test dell'ADF potrebbe interpretare erroneamente le fluttuazioni stagionali come inversioni stocastiche della tendenza deterministica, che implicherebbe radici più piccole dell'unità. (D'altra parte, dato che hai incluso abbastanza ritardi, questo dovrebbe piuttosto apparire come unità radicali (spurie) alle frequenze stagionali, non la frequenza zero / a lungo termine che il test ADF esamina. In ogni caso, dato il modello stagionale è meglio includere i stagionali.)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.