Come interpretare questi grafici acf e pacf


20

Di seguito sono riportati i grafici acf e pacf di una serie di dati mensile. La seconda trama è acf con ci.type = 'ma':

inserisci qui la descrizione dell'immagine

La persistenza di valori elevati nel diagramma acf rappresenta probabilmente una tendenza positiva a lungo termine. La domanda è se questo rappresenta una variazione stagionale?

Ho provato a vedere diversi siti su questo argomento, ma non sono sicuro che queste trame mostrino stagionalità.

Analisi del diagramma ACF e PACF

Aiuta a interpretare i grafici ACF e PACF

Aiuta a comprendere la seguente immagine di ACF

Interpretazione di autocorrelazione e autocorrelazione parziale

Modifica: di seguito è riportato il grafico per il ritardo fino a 60:

inserisci qui la descrizione dell'immagine

Di seguito sono riportati i grafici di diff (my_series):

inserisci qui la descrizione dell'immagine

E fino al ritardo 60:

inserisci qui la descrizione dell'immagine

Modifica: questi dati provengono da: è un metodo appropriato per testare gli effetti stagionali nei dati sul numero dei suicidi? Qui i contributori non hanno preso in considerazione la trama di acf e pacf di serie originali o differenziali degne di nota (quindi non deve essere importante). Solo un diagramma acf / pacf di residui è stato citato in un paio di punti.


1
Puoi aggiungere qualcosa sui tuoi dati (ad es. Una trama di base)? Hai provato qualcosa del genere stl()?
gung - Ripristina Monica

Sto cercando di capire come determinare la stagionalità dai grafici acf e pacf. Per questo è necessaria la revisione della trama di base o della lista? Non possiamo determinare qualcosa da queste trame?
rnso

1
Quello sarebbe ok. Per chiarezza, la tua domanda non riguarda realmente cosa sta succedendo con i tuoi dati, ma riguarda cosa può essere compreso da queste trame in modo isolato, giusto?
gung - Ripristina Monica

1
Sì. Ho spesso bisogno di determinare se la stagionalità è presente nei miei dati, quindi voglio capire quali informazioni posso derivare da grafici acf e pacf. I grafici della funzione stl sono ragionevolmente facili da capire ma non questi grafici.
rnso

I tuoi dati hanno davvero una certa stagionalità. Si prega di vedere la mia risposta a @javlacalle.
IrishStat,

Risposte:


9

guardare i grafici per cercare di incanalare i dati in un modello arima indovinato funziona bene quando 1: non ci sono valori anomali / impulsi / cambiamenti di livello, andamenti dell'ora locale e nessun impulso deterministico stagionale nei dati E 2) quando il modello arima ha parametri costanti nel tempo E 3) quando la varianza dell'errore dal modello arima ha una varianza costante nel tempo. Quando valgono queste tre cose ... nella maggior parte dei set di dati di libri di testo che presentano la facilità della modellazione di arima. Quando 1 o più dei 3 non valgono .... in ogni set di dati del mondo reale che io abbia mai visto. La semplice risposta alla tua domanda richiede l'accesso ai fatti originali (i dati storici) e non alle informazioni descrittive secondarie nelle tue trame. Ma questa è solo la mia opinione!

MODIFICATO DOPO LA RICEZIONE DI DATI:

Ero in vacanza in Grecia (in realtà facendo qualcosa di diverso dall'analisi delle serie temporali) e non ero in grado di analizzare i DATI SUICIDE ma insieme a questo post. È ora giusto e corretto che io sottoponga un'analisi per dare seguito / dimostrare con l'esempio i miei commenti sulle strategie di identificazione del modello multi-stadio e i fallimenti della semplice analisi visiva di semplici grafici di correlazione come "la prova è nel budino".

Ecco l'ACF dei dati originali inserisci qui la descrizione dell'immagineIl PACF della serie originale inserisci qui la descrizione dell'immagine. AUTOBOX http://www.autobox.com/cms/ un software che ho aiutato a sviluppare utilizza l'euristica per identificare un modello di partenza In questo caso si è scoperto che il modello inizialmente identificato era inserisci qui la descrizione dell'immagine. Il controllo diagnostico dei residui di questo modello ha suggerito un aumento del modello usando uno spostamento di livello, impulsi e un impulso stagionale. Si noti che lo spostamento di livello viene rilevato al periodo 164 o circa, il che è quasi identico a una conclusione precedente sul periodo 176 di @forecaster. Tutte le strade non portano a Roma ma alcune possono avvicinarti!inserisci qui la descrizione dell'immagine. Il test della costanza dei parametri ha rifiutato le modifiche dei parametri nel tempo. Il controllo delle variazioni deterministiche nella varianza dell'errore ha concluso che non sono state rilevate modifiche deterministiche nella varianza dell'errore. inserisci qui la descrizione dell'immagine. Il test Box-Cox per la necessità di una trasformazione di potenza è stato positivo con la conclusione che era necessaria una trasformazione logaritmica. inserisci qui la descrizione dell'immagine. Il modello finale è qui inserisci qui la descrizione dell'immagine. I residui del modello finale sembrano essere privi di autocorrelazione inserisci qui la descrizione dell'immagine. La trama dei residui dei modelli finali sembra essere libera da qualsiasi violazione gaussiana inserisci qui la descrizione dell'immagine. La trama di Actual / Fit / Previsioni è qui inserisci qui la descrizione dell'immaginecon le previsioni quiinserisci qui la descrizione dell'immagine


Grazie per la tua risposta. Questi presupposti sono così importanti e sempre così confusi nei dati del mondo reale che le trame acf e pacf non possono quasi mai essere interpretate isolatamente?
anche il

Odio dire mai MA MA le ipotesi che ho presentato complicerebbero gravemente il processo di identificazione visiva se violate. I tuoi dati impostati chiaramente (ai miei vecchi occhi) ne sono un esempio. Identificare un modello iniziale, stimare e ri-identificare sulla base della diagnostica residua è un processo a più stadi non uno e fatto ECCEZIONE in casi banali.
IrishStat,

Per ribadire la seguente amica stats.stackexchange.com/users/48766/javlacalle : è anche necessario verificare la presenza di impulsi e cambiamenti di livello E impulsi stagionali E tendenze dell'ora locale E costanza della varianza degli errori.
IrishStat,

(+1) Bella analisi dei dati. Tuttavia, che dire della domanda originale? la stagionalità può essere identificata nei dati? Forse può essere dedotto dall'output che mostri, ma non sono riuscito a capirlo.
javlacalle,

la stagionalità è presente nel termine AR (12) nel modello ARIMA e nell'impulso stagionale a partire dal periodo 98 (2003/2)
IrishStat

10

Interpretazione di ACF e PACF

Il lento decadimento della funzione di autocorrelazione suggerisce che i dati seguono un processo a memoria lunga. La durata degli shock è relativamente persistente e influenza i dati di diverse osservazioni future. Ciò è probabilmente riflesso da un andamento graduale dei dati.

L'ACF e il PACF dell'ordine 12 sono oltre le bande di confidenza del significato. Tuttavia, ciò non significa necessariamente la presenza di un modello stagionale identificabile. L'ACF e il PACF di altri ordini stagionali (24, 36, 48, 60) rientrano nelle fasce di confidenza. Dal grafico, non è possibile concludere se il significato di ACF e PACF dell'ordine 12 sia dovuto alla stagionalità o alle fluttuazioni transitorie.

La persistenza dell'ACF menzionata in precedenza suggerisce che potrebbero essere necessarie prime differenze per rendere stazionari i dati. Tuttavia, l'ACF / PACF delle serie differenziate sembra sospetto, la correlazione negativa potrebbe essere stata indotta dal filtro di differenziazione e potrebbe non essere effettivamente appropriata. Vedi questo post per alcuni dettagli.

Determina se è presente la stagionalità

L'analisi dell'ACF e del PACF dovrebbe essere integrata con altri strumenti, ad esempio:

  • Lo spettro (in vista dell'ACF nel dominio della frequenza), può rivelare la periodicità dei cicli che spiegano la maggior parte della variabilità nei dati.
  • Montare il modello base strutturale delle serie temporali e verificare se la varianza del componente stagionale è prossima allo zero rispetto agli altri parametri (nella funzione R stats::StructTSe nel pacchetto stsm ).
  • Test di stagionalità, basati su manichini stagionali, cicli stagionali o quelli descritti e implementati in X-12 .
  • Verificare la presenza di impulsi e spostamenti di livello, come indicato dalla IrishStat è anche necessario poiché possono distorcere le conclusioni metodi precedenti (in R i pacchetti tsoutliers possono essere utili a questo scopo).

Ho aggiunto la trama fino al ritardo 60. Quale sarebbe il comando R per ottenere "serie differenziate"? Aggiungerò grafici per diff (my_series).
rnso

@mso ho aggiunto importanti modifiche alla mia risposta precedente. Il comando per le serie differenziate è la funzione diffche hai usato.
javlacalle,

javlacalle - c'erano due paragrafi molto simili e @rnso ha cercato di aiutare rimuovendone uno. Ho rimosso quello che penso sia quello che volevi sostituire. Potresti controllare che il paragrafo corretto sia stato rimosso?
Glen_b

@Glen_b grazie per la modifica, ho apportato alcune modifiche.
javlacalle,

@Javlacalle, @IrishStat: vedi la modifica nella mia domanda sui dati originali.
anche il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.