Serie storiche biologiche multivariate: VAR e stagionalità


15

Ho un set di dati di serie temporali multivariate che include variabili biologiche e ambientali interagenti (più eventualmente alcune variabili esogene). Oltre alla stagionalità, non vi è una chiara tendenza a lungo termine nei dati. Il mio scopo è vedere quali variabili sono correlate tra loro. Le previsioni non sono davvero ricercate.

Essendo nuovo nell'analisi delle serie storiche, ho letto diversi riferimenti. Per quanto ho capito, il modello Vector Autoregressive (VAR) sarebbe appropriato, ma non mi sento a mio agio con la stagionalità e la maggior parte degli esempi che ho trovato riguardavano il campo economico (come spesso con l'analisi delle serie temporali ...) senza stagionalità.

Cosa devo fare con i miei dati stagionali? Ho considerato di destagionalizzarli - per esempio in R, userei decomposee poi userei i $trend + $randvalori per ottenere un segnale che sembra piuttosto stazionario (come giudicato per acf). I risultati del modello VAR mi confondono (viene selezionato un modello a 1 ritardo mentre intuitivamente mi sarei aspettato di più, e solo i coefficienti per l'autoregressione - e non per la regressione con altre variabili ritardate - sono significativi). Sto facendo qualcosa di sbagliato o dovrei concludere che le mie variabili non sono (linearmente) correlate / il mio modello non è quello buono (domanda sussidiaria: esiste un equivalente non lineare di VAR?).

[In alternativa, ho letto che potrei probabilmente usare variabili stagionali fittizie, anche se non riesco a capire esattamente come implementarlo].

I suggerimenti passo-passo sarebbero molto apprezzati, dal momento che i dettagli per gli utenti esperti potrebbero in realtà essere di carattere informativo per me (e naturalmente sono ben accetti frammenti di codice R o collegamenti a esempi concreti).


2
Molto dipende da come pensi alla stagionalità. La mia lettura irregolare della letteratura indica che gli economisti spesso considerano la stagionalità come una seccatura non interessante mentre gli scienziati ambientali spesso si sentono molto più positivi al riguardo. Il metodo delle variabili fittizie come usato nelle cerniere economiche, spesso, sui dati trimestrali o mensili e gli effetti delle vacanze (in ogni senso della parola) a volte spikey; Con dati ambientali a volte puoi fare bene con alcuni termini di Fourier (sinusoidali) e non è necessario ricorrere a manichini.
Nick Cox,

2
Grazie, @Nick Cox. I termini di Fourier non sembrano essere una soluzione nel mio caso particolare, in cui le variabili mostrano uno schema stagionale più complicato dei segnali sinusoidali (a meno che non utilizzi più armoniche, ma questo non è lo scopo qui). E nonostante la stagionalità non sia chiaramente un termine fastidioso nel mio caso, ero più alla ricerca di qualcosa che mi aiutasse a spiegare l'ulteriore variabilità dei dati oltre la stagionalità (cioè la tendenza a lungo termine) in funzione di altre variabili.
ztl

4
Che dire di un modello ARMA multivariato? È simile a VAR, ma se ho capito bene, consente un'interazione più dinamica tra le variabili. Qualcun altro potrebbe essere in grado di confermare / rifiutare il mio sospetto.
Rbatt

Risposte:


1

So che questa domanda è praticamente vecchia ma è rimasta senza risposta. Forse la domanda principale non è come rimuovere il ciclo stagionale nei dati ma è parte di esso, quindi lo proverò: per rimuovere la stagionalità da un set di dati ci sono diversi metodi, dalle semplici medie aggregate mensili a adattando una funzione sinusoidale (o un'altra appropriata armonica) con metodi di adattamento non lineari come Nelder-Mead.

Il modo più semplice è quello di mediare i dati appartenenti a tutti i gennaio, a tutti i febbraio e così via, ovvero creare un ciclo annuale composto, che quindi è possibile sottrarre dai dati

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.