Ho un set di dati di serie temporali multivariate che include variabili biologiche e ambientali interagenti (più eventualmente alcune variabili esogene). Oltre alla stagionalità, non vi è una chiara tendenza a lungo termine nei dati. Il mio scopo è vedere quali variabili sono correlate tra loro. Le previsioni non sono davvero ricercate.
Essendo nuovo nell'analisi delle serie storiche, ho letto diversi riferimenti. Per quanto ho capito, il modello Vector Autoregressive (VAR) sarebbe appropriato, ma non mi sento a mio agio con la stagionalità e la maggior parte degli esempi che ho trovato riguardavano il campo economico (come spesso con l'analisi delle serie temporali ...) senza stagionalità.
Cosa devo fare con i miei dati stagionali? Ho considerato di destagionalizzarli - per esempio in R, userei decompose
e poi userei i $trend + $rand
valori per ottenere un segnale che sembra piuttosto stazionario (come giudicato per acf
). I risultati del modello VAR mi confondono (viene selezionato un modello a 1 ritardo mentre intuitivamente mi sarei aspettato di più, e solo i coefficienti per l'autoregressione - e non per la regressione con altre variabili ritardate - sono significativi). Sto facendo qualcosa di sbagliato o dovrei concludere che le mie variabili non sono (linearmente) correlate / il mio modello non è quello buono (domanda sussidiaria: esiste un equivalente non lineare di VAR?).
[In alternativa, ho letto che potrei probabilmente usare variabili stagionali fittizie, anche se non riesco a capire esattamente come implementarlo].
I suggerimenti passo-passo sarebbero molto apprezzati, dal momento che i dettagli per gli utenti esperti potrebbero in realtà essere di carattere informativo per me (e naturalmente sono ben accetti frammenti di codice R o collegamenti a esempi concreti).