Test statistico per verificare quando due serie temporali simili iniziano a divergere


10

Dal titolo vorrei sapere se esiste un test statistico che può aiutarmi a identificare una divergenza significativa tra due serie temporali simili. In particolare, osservando la figura seguente, vorrei rilevare che le serie iniziano a divergere nel tempo t1, ovvero quando la differenza tra loro inizia a essere significativa. Inoltre, rileverei anche quando la differenza tra le serie ritorna non significativa.

C'è qualche test statistico utile per fare questo?

inserisci qui la descrizione dell'immagine

Risposte:


7

Ci sono alcuni modi che mi vengono in mente. Il primo è prendere la differenza tra le due serie e creare una "nuova serie". Analizza quelle serie e identifica empiricamente Impulsi, Spostamenti di livello / Andamenti dell'ora locale e un possibile componente ARIMA. I risultati suggeriranno / potrebbero suggerire divergenze identificabili. Un secondo approccio è quello di costruire un modello ARIMA comune per entrambe le serie storiche e utilizzare CHOW TEST per testare parametri statisticamente significativi.


1

Un altro approccio che potrebbe funzionare è quello di considerare gli algoritmi per il rilevamento delle modifiche.

Una prima idea è applicare un metodo di rilevamento delle modifiche come CUSUM su entrambe le serie e confrontare i punti di modifica. Nel tuo esempio è molto probabile che le serie rosse produrranno un punto di cambio in t1, mentre quella gialla no. È interessante notare che sia il rosso che il giallo probabilmente darebbero entrambi un punto di cambiamento al primo bump della curva (a seconda della sensibilità dei parametri CUSUM), ma non ti dispiace davvero perché si comportano in modo simile.


1

Alcune opzioni che potresti prendere in considerazione:

  1. Se stai cercando di identificare una differenza significativa, un grafico di Controllo statistico di processo (SPC) che utilizza le regole di Western Electric potrebbe anche aiutarti a identificare che si sta verificando. Come ha suggerito @IrishStat, rappresentare graficamente la differenza tra le due serie storiche è il miglior inizio. Quindi applicare le regole SPC basate sull'analisi di un periodo stabile delle due serie storiche è buono.

https://en.wikipedia.org/wiki/Western_Electric_rules

  1. Un approccio pragmatico più dettagliato è la cronostatistica che sta riscuotendo un ampio consenso nel settore minerario per identificare il cambiamento e le caratteristiche specifiche del rumore nei dati delle serie temporali. Come puoi immaginare, in un ambiente in cui sei interessato allo 0,001% del materiale, l'incertezza nel campionamento e la variabilità del processo devono essere comprese per sapere se hai una differenza in due serie temporali.

Come ingegnere di processo in miniera, sono abituato a gestire i dati di serie temporali che sono molto più rumorosi di così e la cronostatistica (i sostenitori includono Pierre Gy e Francis Pitard) consente di identificare gli errori introdotti dalla tecnica di campionamento dei dati e altri aspetti dei dati raccolta. Documenti più accessibili (vale a dire più facili per gli statistici non professionisti) sono stati scritti da Tim Napier-Munn, che ha un approccio molto basato sull'applicazione per valutare i dati delle serie storiche.

Non sono a conoscenza di alcun documento open source, ma entrambi questi autori hanno pubblicato tramite Elsevier.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.