In che modo ACF e PACF identificano l'ordine dei termini MA e AR?


12

Sono passati più di 2 anni che sto lavorando a diverse serie temporali. Ho letto su molti articoli che ACF viene utilizzato per identificare l'ordine del termine MA e PACF per AR. Esiste una regola del pollice che per MA, il ritardo in cui ACF si interrompe improvvisamente è l'ordine di MA e in modo simile per PACF e AR.

Ecco uno degli articoli che ho seguito dal PennState Eberly College of Science.

La mia domanda è: perché è così? Per me anche ACF può dare il termine AR. Ho bisogno di una spiegazione della regola del pollice sopra menzionata. Non sono in grado di comprendere la regola del pollice in modo intuitivo / matematico per questo -

L'identificazione di un modello AR viene spesso eseguita meglio con il PACF.
L'identificazione di un modello MA viene spesso eseguita meglio con l'ACF piuttosto che con il PACF

Nota: - Non ho bisogno di come, ma "PERCHÉ". :)

Risposte:


9

Le virgolette provengono dal link nell'OP:

L'identificazione di un modello AR viene spesso eseguita meglio con il PACF.

Per un modello AR, il PACF teorico "si spegne" oltre l'ordine del modello. La frase "si spegne" significa che in teoria le autocorrelazioni parziali sono uguali a 0 oltre quel punto. Detto in altro modo, il numero di autocorrelazioni parziali diverse da zero indica l'ordine del modello AR. Per "ordine del modello" intendiamo il ritardo più estremo di x utilizzato come predittore.

... a autoregressione dell'ordine, scritto come AR (k), è una regressione lineare multipla in cui il valore della serie in qualsiasi momento t è una funzione (lineare) dei valori a volte t - 1 , t - 2 , , t - k :ktht1,t2,,tk:

yt=β0+β1yt1+β2yt2++β2ytk+ϵt.

Questa equazione sembra un modello di regressione, come indicato sul paging collegato ... Quindi qual è una possibile intuizione di ciò che stiamo facendo ...

In cinese sussurra o il gioco del telefono come illustrato qui

inserisci qui la descrizione dell'immagine

il messaggio viene distorto quando viene sussurrato da persona a persona e tutte le tracce di somiglianza (qualsiasi parola veritiera, se vuoi) vengono perse dopo il partecipante rosso (ad eccezione dell'articolo "a"). PACF ci direbbe che i coefficienti per i partecipanti blu e giallo sono non contributivi una volta che l'effetto dei partecipanti marrone e rosso viene preso in considerazione (il partecipante verde alla fine della riga non distorce il messaggio).

Non è difficile avvicinarsi molto all'output effettivo della funzione R ottenendo effettivamente regressioni OLS consecutive attraverso l'origine di sequenze più ritardate e raccogliendo i coefficienti in un vettore. schematicamente,

inserisci qui la descrizione dell'immagine

un processo molto simile al gioco per telefono: arriverà un punto in cui non ci sarà alcuna variabilità nel segnale delle serie temporali iniziali effettive che si trovano in frammenti progressivamente più distanti di se stesso.


L'identificazione di un modello MA viene spesso eseguita meglio con l'ACF anziché con il PACF .

Per un modello MA, il PACF teorico non si spegne, ma si assottiglia verso lo 0 in qualche modo. Un modello più chiaro per un modello MA è nell'ACF. L'ACF avrà autocorrelazioni diverse da zero solo ai ritardi coinvolti nel modello.

Un termine medio mobile in un modello di serie storiche è un errore passato (moltiplicato per un coefficiente).

Il modello della media mobile di ordine , indicato da MA (q) èqesimo

Xt=μ+wt+θ1wt-1+θ2wt-2++θqwt-q

conwt~ioiodN(0,σw2).

Qui, non è la somiglianza del messaggio attraverso i punti temporali che viene cercato all'indietro nel tempo passo dopo passo, ma piuttosto il contributo del rumore, che immagino come deviazioni spesso enormi che una passeggiata casuale può portare lungo la linea del tempo:

inserisci qui la descrizione dell'immagine

Qui ci sono sequenze multiple, progressivamente sfalsate, che sono correlate, scartando qualsiasi contributo dei passi intermedi. Questo sarebbe il grafico delle operazioni coinvolte:inserisci qui la descrizione dell'immagine

A questo proposito, "CV è fantastico!" non è completamente diverso da "Naomi ha una piscina". Dal punto di vista del rumore, le rime sono ancora lì fino all'inizio del gioco.


Questa è una risposta davvero interessante, buon lavoro (+1)
Firebug

Rob Hyndman suggerisce questa strategia per ARIMA, che utilizza sia pacf che acf per determinare gli ordini. Dobbiamo sapere in anticipo quali serie dobbiamo utilizzare la strategia descritta nella tua risposta? Grazie!
Stucash

Per favore, prendi la mia risposta come esercizio didattico. Non sono un esperto dell'argomento.
Antoni Parellada

4

Robert Nau della Duke's Fuqua School of Business fornisce una spiegazione dettagliata e in qualche modo intuitiva di come i grafici ACF e PACF possono essere utilizzati per scegliere gli ordini AR e MA qui e qui . Riporto di seguito un breve riassunto delle sue argomentazioni.

Una semplice spiegazione del perché PACF identifica l'ordine AR

Le autocorrelazioni parziali possono essere calcolate inserendo una sequenza di modelli AR che iniziano solo con il primo ritardo e aggiungono progressivamente più ritardi. Il coefficiente di ritardo in un modello AR ( ) fornisce l'autocorrelazione parziale a ritardo . Detto questo, se l'autocorrelazione parziale "interrompe" / cessa di essere significativa ad un certo ritardo (come visto in un diagramma ACF), ciò indica che tale ritardo non aggiunge potere esplicativo a un modello e quindi che l'ordine AR dovrebbe essere il ritardo precedente.KKK

Una spiegazione più completa che affronta anche l'uso di ACF per identificare l'ordine MA

Le serie temporali possono avere firme AR o MA:

  • Una firma AR corrisponde a un diagramma PACF che mostra un taglio netto e un ACF che decade più lentamente;
  • Una firma MA corrisponde a un diagramma ACF che mostra un taglio netto e un diagramma PACF che decade più lentamente.

Le firme AR sono spesso associate all'autocorrelazione positiva al ritardo 1, suggerendo che la serie è leggermente "sottodifferenziata" (ciò significa che sono necessarie ulteriori differenze per eliminare completamente l'autocorrelazione). Poiché i termini AR ottengono una differenziazione parziale (vedi sotto), questo può essere risolto aggiungendo un termine AR al modello (da cui il nome di questa firma). Pertanto un diagramma PACF con un netto taglio (accompagnato da un diagramma ACF in lento decadimento con un primo ritardo positivo) può indicare l'ordine del termine AR. Nau lo dice come gente:

Se il PACF delle serie differenziate mostra un taglio netto e / o l'autocorrelazione lag-1 è positiva - cioè, se la serie appare leggermente "sottodifferenziata" - quindi considerare l'aggiunta di un termine AR al modello. Il ritardo a cui il PACF interrompe è il numero indicato di termini AR.

Le firme MA, d'altra parte, sono comunemente associate a primi ritardi negativi, suggerendo che la serie è "sovra-differenziata" (cioè è necessario annullare parzialmente la differenziazione per ottenere una serie stazionaria). Poiché i termini MA possono annullare un ordine di differenziazione (vedi sotto), il diagramma ACF di una serie con una firma MA indica l'ordine MA necessario:

Se l'ACF delle serie differenziate mostra un taglio netto e / o l'autocorrelazione lag-1 è negativa - cioè, se la serie appare leggermente "sovra-differenziata" - allora considera l'aggiunta di un termine MA al modello. Il ritardo a cui viene interrotta l'ACF è il numero indicato di termini MA.

Perché i termini AR ottengono una differenziazione parziale e i termini MA annullano parzialmente la differenza precedente

Prendi un modello base ARIMA (1,1,1), presentato senza la costante per semplicità:

yt=Yt-Yt-1

yt=φyt-1+et-θet-1

Definendo come operatore lag / backshift , questo può essere scritto come segue:B

yt=(1-B)Yt

yt=φByt+et-θBet

che può essere ulteriormente semplificato per dare:

(1-φB)yt=(1-θB)et

o equivalentemente:

(1-φB)(1-B)Yt=(1-θB)et .

Possiamo vedere che il termine AR (1) ci ha dato il termine , quindi parzialmente (se ) aumentando l'ordine di differenziazione. Inoltre, se manipoliamo come variabile numerica (cosa che possiamo fare perché è un operatore lineare), possiamo vedere che il termine MA (1) ci ha dato il termine , annullando così parzialmente il termine di differenziazione originale— — nella parte sinistra.(1-φB)φ(0,1)B(1-θB)(1-B)


2

A un livello superiore, ecco come capirlo. (Se hai bisogno di un approccio più matematico, posso andare volentieri dopo alcuni dei miei appunti sull'analisi delle serie storiche)

ACF e PACF sono costrutti statistici teorici proprio come un valore o una varianza previsti, ma su domini diversi. Allo stesso modo in cui emergono i valori previsti quando si studiano variabili casuali, ACF e PACF si presentano quando si studiano le serie temporali.

Quando si studiano variabili casuali, c'è la domanda su come stimare i loro parametri, che è dove entrano in gioco il metodo dei momenti, MLE e altre procedure e costrutti, oltre a ispezionare le stime, i loro errori standard e ecc.

Ispezionare l'ACF e il PACF stimati proviene dalla stessa idea, stimando i parametri di un processo casuale di serie temporali. Prendi l'idea?

Se pensi di aver bisogno di una risposta più matematicamente incline, per favore fammi sapere, e proverò a vedere se riesco a creare qualcosa entro la fine della giornata.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.