Stimare i coefficienti ARMA attraverso l'ispezione ACF e PACF


16

Come stimare il modello di previsione appropriato per una serie temporale mediante ispezione visiva dei grafici ACF e PACF? Quale (cioè ACF o PACF) dice all'AR o all'MA (o entrambi)? Quale parte dei grafici indica la parte stagionale e non stagionale di un ARIMA stagionale?

Considerare le funzioni ACF e PCF visualizzate di seguito. Provengono da una serie trasformata in un registro che è stata differenziata due volte, una differenza semplice e una stagionale ( dati originali , dati trasformati in registro ). Come definiresti la serie? Quale modello si adatta meglio?

inserisci qui la descrizione dell'immagine

Risposte:


12

La mia risposta è davvero una raffica di javlacelle ma è troppo lunga per un semplice commento ma non troppo breve per essere inutile.

Mentre la risposta di jvlacelle è tecnicamente corretta ad un certo livello "semplifica eccessivamente" in quanto predispone certe "cose" che normalmente non sono mai vere. Presuppone che non sia richiesta una struttura deterministica come una o più tendenze temporali OPPURE uno o più spostamenti di livello o uno o più impulsi stagionali o uno o più impulsi una tantum. Inoltre, presuppone che i parametri del modello identificato siano invarianti nel tempo e che anche il processo di errore alla base del modello provvisoriamente identificato sia invariante nel tempo. Ignorare quanto sopra è spesso (sempre secondo me!) Una ricetta per il disastro o più precisamente un "modello mal identificato". Un caso classico di ciò è la trasformazione logaritmica non necessaria proposta per le serie aeree e per le serie che l'OP presenta nella sua domanda rivista. Non è necessaria alcuna trasformazione logaritmica per i suoi dati in quanto vi sono solo alcuni valori "insoliti" nei periodi 198.207.218.219 e 256 che non sono stati trattati creano la falsa impressione che vi sia una maggiore varianza di errore con livelli più alti. Si noti che i "valori insoliti" vengono identificati tenendo conto di qualsiasi struttura ARIMA necessaria che spesso sfugge all'occhio umano. Le trasformazioni sono necessarie quando la varianza dell'errore non è costante nel tempo, NON quando la varianza della Y osservata non è costante nel tempo . Le procedure primitive continuano a commettere l'errore tattico di selezionare una trasformazione prematuramente prima di uno qualsiasi dei rimedi summenzionati. Bisogna ricordare che la semplice strategia di identificazione del modello ARIMA è stata sviluppata nei primi anni '60, ma da allora sono proseguiti molti sviluppi / miglioramenti. 219 e 256 che non sono stati trattati creano la falsa impressione che vi sia una maggiore varianza di errore con livelli più alti. Si noti che i "valori insoliti" vengono identificati tenendo conto di qualsiasi struttura ARIMA necessaria che spesso sfugge all'occhio umano. Le trasformazioni sono necessarie quando la varianza dell'errore non è costante nel tempo, NON quando la varianza della Y osservata non è costante nel tempo . Le procedure primitive continuano a commettere l'errore tattico di selezionare una trasformazione prematuramente prima di uno qualsiasi dei rimedi summenzionati. Bisogna ricordare che la semplice strategia di identificazione del modello ARIMA è stata sviluppata nei primi anni '60, ma da allora sono proseguiti molti sviluppi / miglioramenti. 219 e 256 che non sono stati trattati creano la falsa impressione che vi sia una maggiore varianza di errore con livelli più alti. Si noti che i "valori insoliti" vengono identificati tenendo conto di qualsiasi struttura ARIMA necessaria che spesso sfugge all'occhio umano. Le trasformazioni sono necessarie quando la varianza dell'errore non è costante nel tempo, NON quando la varianza della Y osservata non è costante nel tempo . Le procedure primitive continuano a commettere l'errore tattico di selezionare una trasformazione prematuramente prima di uno qualsiasi dei rimedi summenzionati. Bisogna ricordare che la semplice strategia di identificazione del modello ARIMA è stata sviluppata nei primi anni '60, ma da allora sono proseguiti molti sviluppi / miglioramenti. sono identificati tenendo conto di qualsiasi struttura ARIMA necessaria che spesso sfugge all'occhio umano. Le trasformazioni sono necessarie quando la varianza dell'errore non è costante nel tempo, NON quando la varianza della Y osservata non è costante nel tempo. Le procedure primitive continuano a commettere l'errore tattico di selezionare una trasformazione prematuramente prima di uno qualsiasi dei rimedi summenzionati. Bisogna ricordare che la semplice strategia di identificazione del modello ARIMA è stata sviluppata nei primi anni '60, ma da allora sono proseguiti molti sviluppi / miglioramenti. sono identificati tenendo conto di qualsiasi struttura ARIMA necessaria che spesso sfugge all'occhio umano. Le trasformazioni sono necessarie quando la varianza dell'errore non è costante nel tempo, NON quando la varianza della Y osservata non è costante nel tempo. Le procedure primitive continuano a commettere l'errore tattico di selezionare una trasformazione prematuramente prima di uno qualsiasi dei rimedi summenzionati. Bisogna ricordare che la semplice strategia di identificazione del modello ARIMA è stata sviluppata nei primi anni '60, ma da allora sono proseguiti molti sviluppi / miglioramenti. Le procedure primitive continuano a commettere l'errore tattico di selezionare una trasformazione prematuramente prima di uno qualsiasi dei rimedi summenzionati. Bisogna ricordare che la semplice strategia di identificazione del modello ARIMA è stata sviluppata nei primi anni '60, ma da allora sono proseguiti molti sviluppi / miglioramenti. Le procedure primitive continuano a commettere l'errore tattico di selezionare una trasformazione prematuramente prima di uno qualsiasi dei rimedi summenzionati. Bisogna ricordare che la semplice strategia di identificazione del modello ARIMA è stata sviluppata nei primi anni '60, ma da allora sono proseguiti molti sviluppi / miglioramenti.

Modificato dopo la pubblicazione dei dati:

È stato identificato un modello ragionevole utilizzando http://www.autobox.com/cms/ che è un software che incorpora alcune delle mie idee di cui sopra mentre mi aiutava a svilupparlo. inserisci qui la descrizione dell'immagineIl test Chow per la costanza dei parametri ha suggerito che i dati fossero segmentati e che le ultime 94 osservazioni utilizzate come parametri del modello fossero cambiate nel tempo. inserisci qui la descrizione dell'immagineQuesti ultimi 94 valori hanno prodotto un'equazione inserisci qui la descrizione dell'immaginecon tutti i coefficienti significativi. inserisci qui la descrizione dell'immagine. La trama dei residui suggerisce una ragionevole dispersione inserisci qui la descrizione dell'immaginecon il seguente ACF che suggerisce casualità inserisci qui la descrizione dell'immagine. Il grafico reale e pulito si illumina in quanto mostra i sottili ma significativi valori anomali. inserisci qui la descrizione dell'immagine. Finalmente una trama di effettivi, in forma e previsioni sintetizza il nostro lavoro TUTTO SENZA PRENDERE LOGARITMIinserisci qui la descrizione dell'immagine. È risaputo ma spesso dimenticato che le trasformazioni di potere sono come droghe ... un uso ingiustificato può farti del male. Si noti infine che il modello ha una AR (2) MA non una struttura AR (1).


perché non possiamo accettare la trasformazione del registro? Si prega di consultare il set di dati di AirPassengers in R, che ha una stagionalità moltiplicativa. Effettuando il registro, lo trasforma in stagionalità additiva. Inoltre, se non prendiamo i log, il set di dati avrà una varianza crescente, cioè non sarà stazionario. Come posso gestire un set di dati del genere senza eseguire la trasformazione del registro? Puoi spiegare per favore?
user2338823

"Non è necessaria alcuna trasformazione logaritmica per i suoi dati in quanto vi sono solo alcuni valori" insoliti "in periodi che non sono stati trattati creano la falsa impressione che vi sia una maggiore varianza di errore con livelli più alti". il presupposto della stazionarietà della costanza della varianza riguarda la varianza dell'errore e non la varianza della serie originale Il software R non consente di identificare e incorporare automaticamente le anomalie. vedi la discussione autobox.com/cms/index.php/blog sulla serie. AND autobox.com/pdfs/vegas_ibf_09a.pdf
IrishStat

Il test Box-Cox per una trasformazione di potenza ASSUME nessun valore anomalo, quindi può collegare erroneamente / inavvertitamente la variazione della variazione con il valore previsto, suggerendo erroneamente la necessità di una trasformazione. Vedi l'articolo di Tsay docplayer.net/… di uno degli studenti di Box come un'introduzione alla gestione di una struttura deterministica latente non trattata, ciao la strada se non riesci / non riesci a gestire una violazione del primo momento per cui puoi correggere erroneamente la varianza cambia attraverso una trasformazione di potenza o GLS, come sottolinea Tsay.
IrishStat

14

Solo per chiarire i concetti, con l'ispezione visiva di ACF o PACF è possibile scegliere (non stimare) un modello provvisorio di ARMA. Una volta selezionato un modello è possibile stimare il modello massimizzando la funzione di probabilità, minimizzando la somma dei quadrati o, nel caso del modello AR, mediante il metodo dei momenti.

Un modello ARMA può essere scelto dopo l'ispezione di ACF e PACF. Questo approccio si basa sui seguenti fatti: 1) l'ACF di un processo AR stazionario dell'ordine p va a zero a una velocità esponenziale, mentre il PACF diventa zero dopo il ritardo p. 2) Per un processo MA di ordine q, l'ACF teorico e il PACF mostrano il comportamento inverso (l'ACF si interrompe dopo il ritardo q e il PACF si azzera relativamente rapidamente).

Di solito è chiaro rilevare l'ordine di un modello AR o MA. Tuttavia, con processi che includono sia una parte AR che una MA, il ritardo a cui vengono troncati può essere offuscato perché sia ​​l'ACF che il PACF decadono a zero.

Un modo per procedere è quello di adattare prima un modello AR o MA (quello che sembra più chiaro nell'ACF e nel PACF) di ordine basso. Quindi, se esiste qualche ulteriore struttura, questa verrà visualizzata nei residui, quindi l'ACF e il PACF dei residui vengono controllati per determinare se sono necessari ulteriori termini AR o MA.

Di solito dovrai provare a diagnosticare più di un modello. Puoi anche confrontarli guardando l'AIC.

L'ACF e il PACF che hai pubblicato per la prima volta hanno suggerito un ARMA (2,0,0) (0,0,1), ovvero un AR normale (2) e un MA stagionale (1). La parte stagionale del modello è determinata in modo simile alla parte normale ma osserva i ritardi nell'ordine stagionale (ad es. 12, 24, 36, ... nei dati mensili). Se si utilizza R si consiglia di aumentare il numero predefinito di ritardi che vengono visualizzati, acf(x, lag.max = 60).

La trama che mostri ora rivela una correlazione negativa sospetta. Se questa trama è basata sulla stessa trama precedente, potresti aver preso troppe differenze. Vedi anche questo post .

Puoi ottenere ulteriori dettagli, tra le altre fonti, qui: Capitolo 3 in Time Series: Theory and Methods di Peter J. Brockwell e Richard A. Davis e qui .


Hai ragione. Potrei aver preso una differenza di troppo. Ho un dubbio però. Ho fatto una semplice differenza ( i.imgur.com/1MjLzlX.png ) e una stagionale (12) ( i.imgur.com/E64Sd7p.png ) sia sui dati di registro. Quale dovrei guardare, quello stagionale giusto?
4everlearning

1
@ 4everlearning Giusto, dopo aver preso le differenze stagionali, ACF e PACF sembrano più vicini a ciò che potremmo aspettarci da un processo stazionario. Puoi iniziare inserendo un ARIMA (2,0,0) (0,1,1), in R arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1))), e visualizzando l'ACF e il PACF dei residui. Essere consapevoli anche di ulteriori problemi sollevati da IrishStat di cui dovresti occuparti nell'analisi.
javlacalle,

Grazie. Come farei per trovare quegli ordini AR e MA? Inoltre, l'Akaike Information Criterion fornisce un valore negativo per il mio modello. Capisco che questo non è importante, anche se non sono davvero sicuro di come confrontarlo con altri modelli, diciamo AIC = -797.74 e AIC = -800.00. Qual è preferibile?
4everlearning

È possibile determinare gli ordini seguendo l'idea fornita nella risposta sopra. Se vedi che l'ACF si azzera relativamente rapidamente e il PACF si interrompe dopo il ritardo 2, è probabile che nei dati sia presente una struttura AR (2). L'idea inversa si applica per rilevare un MA. Come raccomandazione generale, iniziare con un modello di ordine basso e ispezionare i residui che cercano strutture AR o MA da aggiungere al modello iniziale.
javlacalle,

Come regola generale, più basso è l'AIC, migliore è il modello (supponendo che si stiano utilizzando i dati nella stessa scala in entrambi i modelli, ovvero le serie dovrebbero essere in livelli o registrare tutti i modelli che si stanno confrontando ).
javlacalle,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.