Perché i miei modelli VAR funzionano meglio con i dati non stazionari rispetto ai dati stazionari?


9

Sto usando la libreria VAR statsmodels di Python per modellare i dati finanziari delle serie temporali e alcuni risultati mi hanno lasciato perplesso. So che i modelli VAR presumono che i dati delle serie temporali siano stazionari. Inavvertitamente ho adattato una serie non fissa di prezzi dei tronchi per due diversi titoli e sorprendentemente i valori adattati e le previsioni nel campione erano molto precisi con residui stazionari relativamente insignificanti. L' sulla previsione nel campione era del 99% e la deviazione standard delle serie residue di previsione era circa il 10% dei valori di previsione.R2

Tuttavia, quando faccio differenza tra i prezzi dei tronchi e adatta quelle serie temporali al modello VAR, i valori montati e previsti sono lontani dal segno, rimbalzando in un intervallo ristretto attorno alla media. Di conseguenza, i residui fanno un lavoro migliore prevedendo i rendimenti del registro rispetto ai valori adattati, con la deviazione standard dei residui previsti 15 volte maggiore rispetto alle serie di dati montati un valore di 0,007 per le serie di previsione.R2

Sto interpretando erroneamente i residui rispetto al residuo sul modello VAR o sto facendo qualche altro errore? Perché una serie temporale non stazionaria si tradurrebbe in previsioni più accurate di una stazionaria basata sugli stessi dati sottostanti? Ho lavorato molto con i modelli ARMA della stessa libreria Python e non ho visto nulla di simile a questo modello di dati di singole serie.


5
Due fatti: (1) Quando si regredisce una camminata casuale su un'altra camminata casuale e si assume erroneamente la stazionarietà, si ottengono quasi sempre risultati altamente statisticamente significativi, anche se sono processi indipendenti! . (2) Se due variabili sono cointegrate , puoi regredire l'una sull'altra e il tuo stimatore convergerà più velocemente della regressione normale, un risultato noto come super-coerenza.
Matthew Gunn,

Grazie mille. Il fatto n. 1 spiega sicuramente i risultati per le serie non stazionarie. I risultati delle serie stazionarie certamente agiscono come se mostrassero ciò che tu hai chiamato super-coerenza, tranne per il fatto che le due serie non sono cointegrate, per quanto posso dire. Ho eseguito una regressione lineare sulle due serie di prezzi e i residui erano tutt'altro che stazionari. Quindi dovrei supporre che il modello VAR preveda previsioni così scadenti perché le due serie di ritorno non sono fortemente correlate automaticamente. Il test Granger lo conferma anche.
jpeginternet,

@MatthewGunn, il tuo commento potrebbe adattarsi meglio come risposta.
Richard Hardy,

Risposte:


9

Due fatti:

  1. Quando si regredisce una camminata casuale su un'altra camminata casuale e si assume erroneamente la stazionarietà, il software generalmente restituirà risultati statisticamente significativi, anche se sono processi indipendenti! Ad esempio, vedi queste note di lezione. (Verrà visualizzato Google per una passeggiata casuale spuria e numerosi collegamenti.) Cosa non va? La solita stima OLS e gli errori standard si basano su ipotesi che non sono vere nel caso di passeggiate casuali.

    Fingere che si applichino le solite ipotesi OLS e regredire due passeggiate casuali indipendenti l'una sull'altra porterà generalmente a regressioni con enormi , coefficienti altamente significativi, ed è tutto fasullo! Quando c'è una passeggiata casuale e si esegue una regressione nei livelli vengono violate le solite ipotesi per OLS, la stima non converge come , non si applica il solito teorema limite centrale, e le t-stats e i valori p la tua regressione sputa è tutta sbagliata .R2t

  2. Se due variabili sono cointegrate , puoi regredire l'una sull'altra e il tuo stimatore convergerà più velocemente della regressione normale, un risultato noto come super-coerenza. Per esempio. controlla il libro delle serie storiche di John Cochrane online e cerca "superconsistente".

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.