Cosa fare delle spiegazioni in serie temporali?


11

Avendo lavorato per lo più con dati trasversali finora e, molto recentemente, navigando, scansionando inciampando in un mucchio di letteratura introduttiva sulle serie temporali, mi chiedo quale ruolo svolgano le variabili esplicative nell'analisi delle serie temporali.

Vorrei spiegare una tendenza anziché declinare. La maggior parte di ciò che ho letto come introduzione presuppone che la serie derivi da un processo stocastico. Ho letto dei processi AR (p) e MA, nonché la modellazione ARIMA. Volendo avere a che fare con più informazioni oltre ai soli processi autoregressivi, ho trovato VAR / VECM ed eseguito alcuni esempi, ma mi chiedo ancora se ci sia un caso correlato più vicino a quello che fanno le spiegazioni nelle sezioni trasversali.

La motivazione alla base di ciò è che la decomposizione delle mie serie mostra che la tendenza è il principale contributo, mentre il resto e l'effetto stagionale difficilmente giocano un ruolo. Vorrei spiegare questa tendenza.

Posso / dovrei regredire le mie serie su più serie diverse? Intuitivamente userei gls a causa della correlazione seriale (non sono così sicuro della struttura del cor). Ho sentito parlare di una regressione spuria e ho capito che si tratta di una trappola, tuttavia sto cercando un modo per spiegare una tendenza.

È completamente sbagliato o insolito? O finora mi sono perso il capitolo giusto?

Risposte:


15

Sulla base dei commenti che hai offerto alle risposte, devi essere consapevole della causalità spuria . Ogni variabile con una tendenza temporale sarà correlata con un'altra variabile che ha anche una tendenza temporale. Ad esempio, il mio peso dalla nascita all'età di 27 anni sarà altamente correlato con il peso dalla nascita all'età di 27 anni. Ovviamente, il mio peso non è causato dal tuo peso. Se lo fosse, ti chiederei di andare in palestra più frequentemente, per favore.

xtyt

xt=α0+α1t+ϵt andyt=β0+β1t+ηt.

yt=γ0+γ1xt+νt
xtγ1

Quando si esegue l'analisi delle serie temporali, è necessario assicurarsi che le variabili siano stazionarie o si otterranno questi risultati di causalità spuri. Un'eccezione sarebbero le serie integrate, ma ti rimando ai testi delle serie temporali per saperne di più.


5
+1 per esempio di regressione spuria. Lo impiegherò nelle lezioni :)
mpiktas

1
Eh, vai in palestra per perdere peso? :)
hans0l0

6

La stessa intuizione della regressione della sezione trasversale può essere utilizzata nella regressione delle serie temporali. È perfettamente valido provare a spiegare la tendenza usando altre variabili. La differenza principale è che si presume implicitamente che i regressori siano variabili casuali. Quindi nel modello di regressione:

Yt=β0+Xt1β1+...+Xtkβk+εt

E(εt|Xt1,...,Xtk)=0Eεt=0E(εt2|Xt1,...,Xtk)=σ2Eεt2=σ2

La parte pratica della regressione rimane la stessa, si applicano tutte le normali statistiche e metodi.

Xtk

Il principale avvertimento della regressione delle serie storiche è che può fallire in modo massiccio quando i regressori non sono fermi. Quindi i soliti metodi di regressione possono mostrare che la tendenza è spiegata, mentre in realtà non lo è. Quindi, se si desidera spiegare la tendenza, è necessario verificare la non stazionarietà prima di procedere. Altrimenti potresti arrivare a conclusioni false.


1
Grazie per la vostra pazienza. Tuttavia, il PIL potrebbe essere una possibile spiegazione per la mia variabile. Probabilmente uso meglio i tassi di crescita perché altrimenti rappresenta solo una tendenza temporale qui. Il motivo per cui voglio usare una regressione è perché sono interessato ad estrarre ciò che in realtà NON è spiegato da variabili dell'andamento temporale come il PIL.
hans0l0

1
@ ran2, è sempre meglio usare la crescita del PIL invece del suo valore reale. Nota che l'analisi di regressione può anche dirti quali variabili non spiegano la tendenza, quindi potresti finire con il risultato che non ci sono variabili che possono spiegare la tua tendenza (o le variabili che hai pensato non spiegano la tendenza).
mpiktas,

1
@raegtin, processi stazionari che non hanno secondi momenti per esempio.
mpiktas,

1
L'unica cosa che aggiungerei è di stare attento con l'uso del mondo "spiegare". Ad alcuni recensori non piacerà.
Jase il

1
@Jase, bene ho usato il termine in un certo senso chiesto dall'OP, cioè trovare una relazione statistica significativa.
mpiktas,

3

Quando si dispone di serie di supporto / causali / di aiuto / lato destro / esogene / predittore, l'approccio preferito è quello di costruire una singola equazione, funzione di trasferimento a input multiplo. È necessario esaminare i possibili residui del modello sia per gli input deterministici non specificati / omessi, ad es. Per il rilevamento di interventi ala Ruey Tsay 1988 Journal of Forecast, sia per gli input stocastici non specificati tramite un componente ARIMA. Quindi puoi includere esplicitamente non solo i causali suggeriti dall'utente (e tutti i ritardi necessari!) Ma due tipi di strutture omesse (manichini e ARIMA).

Bisogna fare attenzione a garantire che i parametri del modello finale non cambino in modo significativo nel tempo, altrimenti la segmentazione dei dati potrebbe essere in ordine e che i residui del modello finale non possono dimostrare di avere una varianza eterogenea.

L'andamento delle serie originali può essere dovuto alle tendenze nelle serie predittive o alle dinamiche autoregressive nelle serie di interesse o potenzialmente a causa di una serie deterministica omessa sospinta da una costante di stato stabile o anche da una o più tendenze temporali locali.


0

Come punto di vista meno tecnico, spesso non è molto utile spiegare semplicemente la tendenza; cioè, trattare il tempo come il predittore di interesse primario. La variazione di una serie nel tempo spesso implica gli effetti sottostanti di altre variabili, inclusi i processi autoregressivi e / o esogeni, che è concettualmente più rilevante da indagare. Ne consegue che se anche queste variabili variano nel tempo, in effetti è necessario controllare l'effetto del tempo per non ricadere nella relazione artificialmente significativa come ha mostrato @mpiktas.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.