Correlazione tra due serie storiche


24

Qual è il modo / metodo più semplice per calcolare la correlazione tra due serie temporali che hanno esattamente le stesse dimensioni? Ho pensato di moltiplicare e ( y [ t ] - μ y ) e di sommare la moltiplicazione. Quindi, se questo singolo numero fosse positivo, possiamo dire che queste due serie sono correlate? Posso pensare ad alcuni esempi in cui una serie temporale in modo lineare un'altra in crescita esponenziale non avrebbe alcuna relazione reciproca, ma il calcolo sopra riportato riferirebbe che erano correlati.(x[t]μx)(y[t]μy)

qualche idea?


3
Hai mai sentito parlare della funzione di correlazione incrociata - en.wikipedia.org/wiki/Cross-correlation#Time_series_analysis ?
Macro

Le tue due serie temporali hanno esattamente le stesse dimensioni. Vedi stats.stackexchange.com/questions/3463/… come simile, non del tutto identico alla tua domanda, con due serie della stessa dimensione e frequenza, sebbene non stazionarie.
Ellie Kesselman,

Risposte:


11

Il punto di macro è corretto, il modo corretto di confrontare le relazioni tra serie temporali è tramite la funzione di correlazione incrociata (assumendo la stazionarietà). Avere la stessa lunghezza non è essenziale. La correlazione incrociata al ritardo 0 calcola solo una correlazione come fare la stima della correlazione di Pearson accoppiando i dati negli stessi punti temporali. Se hanno la stessa lunghezza che stai assumendo, avrai coppie T esatte dove T è il numero di punti temporali per ogni serie. La correlazione incrociata del ritardo 1 corrisponde al tempo t della serie 1 con il tempo t + 1 della serie 2. Nota che qui, anche se le serie hanno la stessa lunghezza, hai solo una coppia T-2 poiché un punto nella prima serie non ha corrispondenza nella seconda e un altro punto della seconda serie non avrà una corrispondenza dalla prima. Date queste due serie è possibile stimare la correlazione incrociata a più ritardi. Se una delle correlazioni incrociate è statisticamente significativamente diversa da 0, indicherà una correlazione tra le due serie.


Ciao Michael, è possibile quantificare "significativamente diverso" - posso usare 1 o 2 deviazioni standard da zero come significative?
BBDynSys,

@ user423805 L'ho modificato per leggere statisticamente significativamente diverso da 0. Formalmente ciò significa che si verifica l'ipotesi nulla che la correlazione sia zero rispetto all'alternativa che non è 0. Quindi calcolare il valore p bilaterale per la statistica test . Significato p generalmente statistico valore medio <= 0,05. Talvolta vengono utilizzati altri valori per definire la significatività statistica (ad esempio 0,01). La maggior parte dei pacchetti software di serie temporali che includono serie temporali multiple può eseguire questi test. Il nostro amico IrishStat può parlare di questo riguardo Autobox.
Michael R. Chernick,

ci sono casi in cui la correlazione incrociata a ritardo zero e pearson differiscono?
Bakaburg,

4

Potresti voler esaminare una domanda simile e la mia risposta Volumetria di volumi correlati che suggerisce che puoi calcolare le correlazioni incrociate MA testarle è un cavallo di un colore diverso (un equino di una tonalità diversa) a causa della struttura autoregressiva o deterministica all'interno di una serie.


se ho capito bene, in quella risposta stai dicendo che la crosscorrelazione tra la serie temporale è inutile.
BBDynSys,

user423805 POTREBBE essere inutile a meno che i dati non siano opportunamente pre-filtrati per ottenere l'IID. Questo parla direttamente alle preoccupazioni reali del PO circa le conclusioni spurie come "cicogne che portano i bambini J. Neyman 1938 en.wikipedia.org/wiki/… e amstat.org/about / statisticiansinhistory / ... "etc (posso pensare ad alcuni esempi in cui una serie temporale in modo lineare un'altra crescita esponenziale non avrebbe alcuna relazione reciproca, ma il calcolo sopra riportato riferirebbe che erano correlati.)
IrishStat

Penso che il punto sia che le serie debbano essere stazionarie affinché le crosscorrelazioni abbiano un senso. Se il filtraggio è necessario, è necessario rendere la serie stazionaria (come la differenziazione o la differenziazione stagionale). Ma chiamarlo inutile è sbagliato.
Michael R. Chernick,

@Michael, ho detto che potrebbe essere inutile.
IrishStat,

@IrishStat È stato un bel commento e mi ha riportato alla mia formazione negli anni '70. A quel tempo stavo imparando le serie temporali / i metodi di previsione per il mio lavoro civile nell'esercito degli Stati Uniti. Stavamo usando il livellamento esponenziale come modo per prevedere basato su dati storici su stime soggettive che venivano utilizzate nei depositi di approvvigionamento. Qualcuno mi ha dato il grande suggerimento di guardare i modelli ARIMA più generali e il testo del 1970 di Box e Jenkins e così ha iniziato il mio interesse per le serie storiche che sono diventate parte della mia carriera.
Michael R. Chernick,

-1

Ci sono alcune cose interessanti qui

/programming/3949226/calculating-pearson-correlation-and-significance-in-python

Questo era in realtà quello di cui avevo bisogno. Semplice da implementare e spiegare.


2
-1 Da quello che posso raccogliere, queste risposte riguardano solo la correlazione standard momento-prodotto di Pearson. Se applicato a due serie temporali, la correlazione standard di Pearson fornisce risultati senza senso! Se segui questi suggerimenti, tutto ciò che fai è produrre artefatti statistici. Vedi ad esempio math.mcgill.ca/dstephens/OldCourses/204-2007/Handouts/…
Momo
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.