In quali circostanze è appropriato un processo MA o AR?


21

Capisco che se un processo dipende da precedenti valori di se stesso, allora è un processo AR. Se dipende da errori precedenti, allora è un processo MA.

Quando si verificherebbe una di queste due situazioni? Qualcuno ha un solido esempio che illumina il problema alla base di ciò che significa che un processo deve essere modellato al meglio come MA vs AR?


3
Una dicotomia non è così semplice; dopo tutto, un AR può essere scritto come un MA infinito e un MA (invertibile) può essere scritto come un AR infinito, quindi se uno dei due è sempre appropriato, probabilmente lo è anche l'altro.
Glen_b

1
Glen_b, puoi approfondire questo? Capisco che non è una semplice dicotomia ... ho ragione a supporre (anche la speranza) che qui valga la pena scoprire qualcosa che vale la pena scoprire? Non voglio semplicemente eseguire acf / pacf e fingere di avere una buona conoscenza di questo processo.
Matt O'Brien,

Risposte:


10

Un risultato importante e utile è il teorema della rappresentazione di Wold (a volte chiamato decomposizione di Wold), che afferma che ogni serie stazionaria di covarianza può essere scritta come la somma di due serie temporali, una deterministica e una stocastica.Yt

Yt=μt+j=0bjεtj , dove è deterministico.μt

Il secondo termine è un MA infinito.

(È anche il caso che un MA invertibile possa essere scritto come un processo AR infinito.)

Ciò suggerisce che se la serie è covarianza-stazionaria e se assumiamo che tu possa identificare la parte deterministica, puoi sempre scrivere la parte stocastica come un processo MA. Allo stesso modo se l'MA soddisfa la condizione di invertibilità è sempre possibile scriverlo come processo AR.

Se hai il processo scritto in una forma puoi spesso convertirlo nell'altra forma.

Quindi, almeno in un certo senso, per le serie stazionarie di covarianza, spesso AR o MA saranno appropriate.

Certo, in pratica preferiremmo non avere modelli molto grandi. Se hai un AR o MA finito, sia l'ACF che il PACF alla fine decadono geometricamente (c'è una funzione geometrica che il valore assoluto di entrambe le funzioni si troverà sotto), il che tenderà a significare che una buona approssimazione di un AR o di un MA in altra forma può spesso essere ragionevolmente breve.

Quindi, nella condizione stazionaria di covarianza e supponendo che possiamo identificare le componenti deterministiche e stocastiche, spesso sia AR che MA possono essere appropriate.

La metodologia Box e Jenkins cerca un modello parsimonioso: un modello AR, MA o ARMA con pochi parametri. Tipicamente ACF e PACF sono usati per cercare di identificare un modello, trasformandosi in stazionarietà (forse per differenza), identificando un modello dall'aspetto di ACF e PACF (a volte le persone usano altri strumenti), adattando il modello e quindi esaminando il struttura dei residui (in genere tramite ACF e PACF sui residui) fino a quando la serie residua appare ragionevolmente coerente con il rumore bianco. Spesso ci saranno più modelli che possono fornire un'approssimazione ragionevole a una serie. (In pratica vengono spesso considerati altri criteri.)

Ci sono alcuni motivi per criticare questo approccio. Per un esempio, i valori di p che derivano da un tale processo iterativo generalmente non tengono conto del modo in cui il modello è stato raggiunto (osservando i dati); questo problema potrebbe essere almeno in parte evitato dalla divisione del campione, ad esempio. Un secondo esempio di critica è la difficoltà di ottenere effettivamente una serie stazionaria - mentre in molti casi ci si può trasformare per ottenere una serie che sembra ragionevolmente coerente con la stazionarietà, di solito non è il caso che sia realmente (problemi simili sono comuni problema con i modelli statistici, anche se forse a volte potrebbe essere più un problema qui).

[La relazione tra un AR e il corrispondente MA infinito è discussa nelle previsioni di Hyndman e Athanasopoulos : principi e pratica , qui ]


1
-1 perché, sebbene sia un po 'interessante, in realtà non risponde allo spirito della domanda.
Jake Westfall,

Ciao Jake, grazie per aver aggiunto il commento su ciò che pensi sia sbagliato nella risposta. Questo è molto più utile di quanto non sarebbe un solo voto negativo. Sono d'accordo che qui manchi qualcosa - per lo meno dovrebbe essere chiarito il motivo per cui ho pensato che fosse abbastanza rilevante da pubblicare come risposta.
Glen_b

1
@jake Ho apportato alcune modifiche che spero rendano più chiara la connessione alla domanda. Grazie ancora per il tuo aiuto
Glen_b -Restate Monica

Grazie per le modifiche. Ho rimosso il mio voto negativo. La mia condensazione di una frase della tua risposta rivista sarebbe qualcosa del tipo: "Questa è una domanda difficile a cui rispondere in generale perché, in molti casi, un modello AR o MA potrebbe adattarsi ai dati così come l'altro. " Che è una risposta legittima, anche se deludente, alla domanda.
Jake Westfall,

@Jake non sente la necessità di rimuovere il downvote se hai ancora delle riserve; Apprezzo la possibilità di migliorare la risposta in entrambi i modi.
Glen_b -Restate Monica

5

Posso fornire quella che penso sia una risposta convincente alla prima parte della domanda ("da dove MA?"), Ma attualmente sto meditando una risposta altrettanto convincente alla seconda parte della domanda ("da dove AR?").

Considera una serie consistente nel prezzo di chiusura (rettificato per frazioni e dividendi) di un'azione in giorni consecutivi. Il prezzo di chiusura di ogni giorno deriva da una tendenza (ad esempio, lineare nel tempo) più gli effetti ponderati degli shock giornalieri dei giorni precedenti. Presumibilmente, l'effetto dello shock al giorno t-1 avrà un'influenza più forte sul prezzo al giorno t rispetto allo shock al giorno t-2, ecc. Pertanto, logicamente, il prezzo di chiusura del titolo al giorno t rifletterà la tendenza valore al giorno t più una costante (inferiore a 1) volte la somma ponderata degli shock fino al giorno t-1 (ovvero, il termine di errore al giorno t-1) (MA1), eventualmente più una costante (inferiore a 1) volte la somma ponderata degli shock fino al giorno t-2 (ovvero, il termine di errore al giorno t-2) (MA2), ..., più il nuovo shock al giorno t (rumore bianco). Questo tipo di modello sembra appropriato per modellare serie come il mercato azionario, in cui il termine di errore al giorno t rappresenta la somma ponderata degli shock precedenti e attuali e definisce un processo MA. Sto lavorando attraverso una logica altrettanto convincente per un processo esclusivamente-AR.


3
+1. Questa è l'unica risposta finora che tenta persino di rispondere alla domanda originale.
S. Kolassa - Ripristina Monica

Se ho capito bene, sembra che il processo AR sia migliore per correggere tendenze ricorrenti, ma MA è meglio per correggere shock grandi e non ricorrenti.
Mike Campbell,

0

Questo è l'esempio più semplice che ho potuto trovare per aiutare a visualizzare i processi AR, MA e ARMA.

Si noti che questo è solo un aiuto visivo per un'introduzione sull'argomento e non è abbastanza rigoroso da tenere conto di tutti i casi possibili.

Supponiamo quanto segue: abbiamo due agenti in una competizione che hanno il compito di eseguire un certo tipo di azione (saltare orizzontalmente a destra).

  1. L '"Umano" dovrebbe, in media, coprire una distanza di "μ" con una deviazione standard di "𝛿" ad ogni salto secondo le sue capacità fisiche. Tuttavia, l'essere umano è particolarmente carente di forza mentale :) e le sue prestazioni dipendono anche dal fatto che il salto precedente sia rimasto indietro / incontrato / superato le sue aspettative.

  2. La "Macchina" è stata progettata secondo le stesse specifiche dell'essere umano sopra con una sola differenza: la macchina è priva di emozioni e non è influenzata dalle prestazioni passate.

Inoltre, ci sono due giochi che devono essere giocati da entrambi gli agenti con ogni gioco che comporta due salti:

  1. "Salto finale" ha segnato sulla base della distanza coperta nel salto finale dopo un salto di riscaldamento il cui risultato è ignorato nella competizione ma che l'essere umano può osservare. Il salto finale inizia dove inizia il salto di riscaldamento.

  2. Il “Combined Jump” ha segnato sulla base della distanza combinata coperta nei salti iniziali e finali. Il salto finale inizia dove atterra il salto iniziale.

La tabella seguente mostra quale modello descriverebbe meglio ciascuno dei quattro scenari associati agli attori e ai giochi di cui sopra.

Diagramma che descrive le differenze tra i processi AR, MA e ARMA


Questo poster ha bisogno di spiegazioni e contesto per essere comprensibile. Potresti fornirlo nella tua risposta?
whuber

-1

Quindi hai una serie temporale univariata e vuoi modellarla / prevederla, giusto? Hai scelto di utilizzare un modello di tipo ARIMA.

I parametri del dipendono da ciò che è meglio per il tuo set di dati. Ma come lo scopri? Un approccio recente è "Previsione automatica di serie storiche" di Hyndman & Khandakar (2008) ( pdf ).

L'algoritmo prova diverse versioni di p, q, P e Q e sceglie quella con il più piccolo AIC, AICc o BIC. È implementato nella funzione auto.arima () di pacchetto R di previsione . La scelta del criterio di informazione dipende dai parametri che si passano alla funzione.

Per un modello lineare, la scelta di un modello con il più piccolo AIC può equivalere a una validazione incrociata univoca.

Dovresti anche assicurarti di avere abbastanza dati, almeno quattro anni.

Alcuni controlli importanti:

  1. Il modello ha senso? Ad esempio, se si hanno vendite al dettaglio mensili, probabilmente ci si aspetta che un modello stagionale sia adatto.
  2. Quanto bene prevede il campione?

Risposta esplicita al commento di Firebug di seguito: quando i tuoi dati lo supportano.


3
Questa risposta non risponde affatto alla domanda:"My question is, when would one of either of these two situations occur? "
Firebug

1
"Risposta esplicita al commento di Firebug di seguito: quando i tuoi dati lo supportano." Sono d'accordo con @Firebug - questa non è una risposta alla domanda e sicuramente non è un valido esempio per la differenziazione tra i due ...
Thomas

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.