Serie temporali multivarianti in R. Come trovare correlazioni ritardate e costruire un modello per la previsione


16

Sono nuovo nella pagina e abbastanza nuovo nelle statistiche e R. Sto lavorando a un progetto per il college con l'obiettivo di trovare la correlazione tra pioggia e livello del flusso d'acqua nei fiumi. Una volta dimostrata la correlazione, voglio prevederla / prevederla.

I dati Ho una serie di dati di diversi anni (presi ogni 5 minuti) per un particolare fiume contenente:

  • Pioggia in millimetri
  • Flusso del fiume in metri cubi al secondo

Questo fiume non ha neve, quindi il modello si basa solo sulla pioggia e sul tempo. Ci sono occasionalmente temperature di congelamento, ma sto pensando di rimuovere quei periodi dai dati come valori anomali in quanto quella situazione non rientra nell'ambito del mio progetto.

Esempi Qui hai un paio di grafici di dati di esempio relativi a una pioggia e al sorgere di acqua poche ore dopo.

Più grande esempio alcuni giorni

Esempio più breve di un solo periodo di pioggia

La linea rossa è il flusso del fiume. L'arancia è la pioggia. Puoi vedere che piove sempre prima che l'acqua si alzi nel fiume. C'è un po 'di pioggia che ricomincia alla fine della serie storica, ma influenzerà il flusso del fiume in seguito.

La correlazione è lì. Ecco cosa ho fatto in R per dimostrare la correlazione usando ccf in R:

  • la correlazione incrociata
  • la variabile principale
  • il ritardo

Questa è la mia linea R utilizzata per il secondo esempio (un periodo di pioggia):

ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")

risultato ccf per il piccolo esempio 2

La mia interpretazione è:

  • che porta la pioggia (succede prima),
  • 450
  • 450800ccf

Ho ragione?

A proposito delle serie storiche . Questa serie storica non ha periodicità o stagionalità. La pioggia può arrivare in qualsiasi momento e provocare un effetto. Riduce in estate, ma succede ancora, è una zona con molta pioggia tutto l'anno.

Modello e previsioni. Non so come creare un modello per poter fare una previsione che mi dice quanto un fiume aumenterà il volume dopo un periodo di pioggia. Ci ho provato arima, auto arimama non ho avuto molto successo. Dovrei usare Arima, varso altro modello multivariato di diverso? Qualsiasi collegamento a un esempio sarebbe di grande aiuto.

Per favore, fammi sapere se conosci il modo migliore per creare questa previsione, quale modello dovrei usare. Ci sono alcune altre cose che sto pensando di fare ma le ho tolte da questa spiegazione per semplicità. Posso condividere alcuni dati, se necessario.


stai cercando analisi di intervento (il sottoinsieme è chiamato "studi di eventi" negli studi sociali)
Konstantinos

Risposte:


3

Devi utilizzare i tuoi comportamenti ACF e PACF per aiutarti a determinare quale modello si adatta meglio ai tuoi dati (ad es. Un'esistenza di decadimento lento nel diagramma ACF indica che potrebbe essere necessario differenziare per rendere le serie più stabilizzate. Il tuo diagramma ACF mostra ovviamente che una sorta di trasformazione è necessario. La fluttuazione deve essere meno varia e all'interno delle linee blu se si utilizza la trasformazione corretta (serie stazionaria). Una volta rese stazionarie le serie, pensare a quale modello AR, MA, ARMA o ARIMA è appropriato. Nel mio progetto ho fatto quanto segue per aiutare nella selezione del modello:

Il diagramma ACF mostra un valore relativamente grande al ritardo 2 ( vedere dove si trova nel diagramma ). A parte ciò, diventa sostanzialmente zero a ritardi maggiori di due. Ciò suggerisce che un modello MA (2) potrebbe adattarsi ai dati e quindi osservando il diagramma PACF notiamo immediatamente che la correlazione è zero quasi in ritardo. Questo può suggerire che il modello non ha alcuna parte AR su di esso ( adattalo alla tua trama). Pertanto, uno dei nostri modelli candidati potrebbe essere un ARIMA (p, d, q) con parametri p = 0, d = 1 e q = 1 o2. Ho anche provato alcuni ordini superiori di MA e preso in considerazione la possibilità di avere una parte AR nel modello al fine di confrontare i risultati di AIC, AICc e BIC e decidere il modello finale. il prossimo passo dovrai eseguire alcuni test diagnostici per assicurarti di aver scelto il modello corretto e non ci sono schemi nei tuoi residui (ACF e PACF per i residui, valore p per la statistica di Ljung-Box, istogramma per i residui e Trama QQ). Spero che sia d'aiuto!

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.