Termini di errore del modello a media mobile


17

Questa è una domanda di base sui modelli Box-Jenkins MA. Ho capito, un modello MA è fondamentalmente una regressione lineare di serie temporali valori Y contro precedente termini di errore et,...,etn . Cioè, l'osservazione Y viene dapprima regredito contro il suo valori precedenti Yt1,...,Ytn e poi uno o più YY^ valori vengono utilizzati come termini di errore per il modello MA.

Ma come vengono calcolati i termini di errore in un modello ARIMA (0, 0, 2)? Se il modello MA viene utilizzato senza una parte autoregressiva e quindi senza un valore stimato, come posso avere un termine di errore?


1
No, penso che tu stia confondendo la definizione di un modello MA (n), in cui la regressione è solo in termini di eti , con la sua stima, in cui gli eti sono stimati dai dati .
Xi'an,

1
Il problema principale nella tua domanda è che dici che il modello MA è sostanzialmente una regressione lineare. Questo semplicemente non è vero, dal momento che non osserviamo termini di errore.
mpiktas,

Credo che il termine di errore è in realtà YtYt^ , dove Y è E ( Y | Y t , . . . , T - n ) o semplicemente Y t - Y t - 1 . Questo è il motivo per cui una stima dei parametri del modello MA è derivata da un modello ricorrente nella funzione di autocorrelazione parziale Y , ovvero il comportamento dei residui. La stima del parametro AR si basa invece su un modello ricorrente di acf (Y).Y^E(Y|Yt,...,tn)YtYt1Y
Robert Kubrick,

Risposte:


20

Stima del modello MA:

Supponiamo una serie con 100 punti temporali e diciamo che questo è caratterizzato dal modello MA (1) senza intercettazione. Quindi il modello è dato da

yt=εtθεt1,t=1,2,,100(1)

Il termine di errore qui non viene osservato. Quindi, per ottenere questo, Box et al. Analisi delle serie storiche: previsioni e controllo (3a edizione) , pagina 228 , suggeriscono che il termine di errore sia calcolato in modo ricorsivo da,

εt=yt+θεt1

Quindi il termine di errore per è, ε 1 = y 1 + θ ε 0 Ora non possiamo calcolarlo senza conoscere il valore di θ . Pertanto, per ottenere ciò, è necessario calcolare la stima iniziale o preliminare del modello, fare riferimento a Box et al. di detto libro, la Sezione 6.3.2 pagina 202 afferma che,t=1

ε1=y1+θε0
θ

È stato dimostrato che le prime autocorrelazioni del processo MA ( q ) sono diverse da zero e possono essere scritte in termini di parametri del modello come ρ k = - θ k + θ 1 θ k + 1 + θ 2 θ k + 2 + + θ q - k θ qqq L'espressione precedente per ρ 1 , ρ 2, ρ q in termini θ 1 , θ 2 , , θ q , forniture q equazioni in q incognite. Le stime preliminari degli θ possono essere ottenute sostituendo le stime r k con ρ k nell'equazione sopra

ρk=θk+θ1θk+1+θ2θk+2++θqkθq1+θ12+θ22++θq2k=1,2,,q
ρ1,ρ2,ρqθ1,θ2,,θqqqθrkρk

Si noti che è l'autocorrelazione stimata. Ci sono ulteriori discussioni nella Sezione 6.3 - Stime iniziali per i parametri , si prega di leggere su questo. Ora, supponendo di ottenere la stima iniziale θ = 0,5 . Quindi, ε 1 = y 1 + 0,5 ε 0 Ora, un altro problema è che non abbiamo valore per ε 0 perché t inizia da 1, quindi non possiamo calcolare ε 1 . Fortunatamente, ci sono due metodi per ottenerlo,rkθ=0.5

ε1=y1+0.5ε0
ε0tε1
  1. Probabilità condizionale
  2. Probabilità incondizionata

Secondo Box et al. Nella sezione 7.1.3 pagina 227 , i valori di possono essere sostituiti a zero come approssimazione se n è moderato o grande, questo metodo è Probabilità condizionale. Altrimenti, viene usata la verosimiglianza incondizionata, in cui il valore di ε 0 è ottenuto mediante previsionali, Box et al. consiglia questo metodo. Maggiori informazioni sulla previsione a posteriori alla Sezione 7.1.4 a pagina 231 .ε0nε0

Dopo aver ottenuto le stime iniziali e il valore di , possiamo finalmente procedere con il calcolo ricorsivo del termine di errore. Quindi la fase finale è stimare il parametro del modello ( 1 ) , ricordare che questa non è più la stima preliminare.ε0(1)

Nella stima del parametro , utilizzo la procedura di stima non lineare, in particolare l'algoritmo Levenberg-Marquardt, poiché i modelli MA non sono lineari sul suo parametro.θ

Nel complesso, ti consiglio vivamente di leggere Box et al. Analisi delle serie storiche: previsioni e controllo (3a edizione) .


Puoi spiegare cosa è ? rk
Piyush Divyanakar,

4

Un modello MA (q) gaussiano è definito (non solo da Box e Jenkins!) Come quindi il modello MA (q) è un modello di errore "puro", il grado q che definisce fino a che punto risale la correlazione.

Yt=i=1qϑieti+σet,etiidN(0,1)
q

1
etetq

1
Perché c'è un segno negativo nella tua formula? Di solito il meno è per i modelli AR. Matematicamente non è un problema, sono solo curioso, dal momento che non ho mai visto meno nei modelli MA.
mpiktas,

3
et

1
YE(Y)

1

YYt1,...,YtnYY^Yet1et2et which will be uncorrelated for all i=3,4,,,,t .We then have two regression coefficients: θ1 representing the impact of et1 and θ2 representing the impact of et2. Thus et is a white noise random series containing n-2 values. Since we have n-2 estimable relationships we start with the assumption that e1 and e2 are equal to 0.0 . Now for any pair of θ1 and θ2 we can estimate the t-2 residual values. The combination that yields the smallest error sum of squares would then be the best estimates of θ1 and θ2.


What are the 2 other predictor series? I am asking because when I look at the literature I have it's never clearly specified. Are these 2 other series unrelated to Y? I had the impression that all ARIMA formulation is limited to the Y series.
Robert Kubrick

1
The 2 predictors are the lags of the error terms. Since these are not known a priori since we do not know the error terms before we begin is why this has to be treated by non-linear estimation.The confusion you are having is that a model that is finite in the past ( i.e. an AR MODEL ) is potentially infinite in the errors AND a model that is finite in the errors ( i.e. an MA MODEL) is potentially infinite in the past of Y.The reason one selects an AR MODEL versus an MA MODEL is for parsimony. Sometimes we construct an ARMA MODEL which blends both the history of Y and the history of the errors.
IrishStat

1
As I commented in the other answer, what I am still missing is what's the optimal forecast for Y, which is used to calculate the innovation etn.
Robert Kubrick,

1

See my post here for an explanation of how to understand the disturbance terms in a MA series.

You need different estimation techniques to estimate them. This is because you cannot first get the residuals of a linear regression and then include the lagged residual values as explanatory variables because the MA process uses the residuals of the current regression. In your example you are making two regression equations and using residuals from one into the other. This is not what an MA process is. It cannot be estimated with OLS.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.