Processo AR (1) con errori di misura eteroscedastici


13

1. Il problema

Ho alcune misure di una variabile yt , dove t=1,2,..,n , per cui ho una distribuzione fyt(yt) ottenuto tramite MCMC, che per semplicità Si assume una gaussiana di media μt e varianza σt2 .

Ho un modello fisico per quelle osservazioni, diciamo g(t) , ma i residui rt=μtg(t) sembrano essere correlati; in particolare, ho ragioni fisiche per pensare che basterà un processo AR(1) per tenere conto della correlazione e intendo ottenere i coefficienti di adattamento tramite MCMC, per i quali ho bisogno della probabilità . Penso che la soluzione sia piuttosto semplice, ma non sono abbastanza sicuro (sembra così semplice, che penso che mi manchi qualcosa).

2. Derivazione della probabilità

Un processo a media zero AR(1)può essere scritto come:

Xt=ϕXt1+εt,   (1)
dove assumerò εtN(0,σw2) . I parametri da stimare sono, quindi, θ={ϕ,σw2} (nel mio caso, devo anche aggiungere i parametri del modello g(t), ma non è questo il problema). Ciò che osservo, tuttavia, è la variabile
Rt=Xt+ηt,   (2)
dove sto assumendo ηtN(0,σt2) , e sono noti σt2 (errori di misurazione) . Poiché Xt è un processo gaussiano, anche Rt è. In particolare, so che quindi, R 1N ( 0 , σ 2 w / [ 1 - ϕ 2 ] + σ 2 t ) . La prossima sfida è ottenere R t | R t - 1 per t 1 . Per derivare la distribuzione di questa variabile casuale, si noti che, usando eq. ( 2 ) So scrivere X t
X1N(0,σw2/[1ϕ2]),
R1N(0,σw2/[1ϕ2]+σt2).
Rt|Rt1t1(2) Usando l'eq. (2)e usando la definizione di eq. (1), posso scrivere, R t = X t + η t =ϕ X t - 1 + ε t + η t . Usando l'eq. (3)in quest'ultima espressione, quindi, ottengo, R t
Xt1=Rt1ηt1.   (3)
(2)(1)
Rt=Xt+ηt=ϕXt1+εt+ηt.
(3) quindi R t | R t - 1 = ϕ ( r t - 1 - η t - 1 ) + ε t + η t , e, quindi, R t | R t - 1N (
Rt=ϕ(Rt1ηt1)+εt+ηt,
Rt|Rt1=ϕ(rt1ηt1)+εt+ηt,
Infine, posso scrivere la funzione di verosimiglianza come L ( θ ) = f R 1 ( R 1 = r 1 ) n t = 2 f R t | R t - 1 ( R t = r t
Rt|Rt1N(ϕrt1,σw2+σt2ϕ2σt12).
dove f ( )
L(θ)=fR1(R1=r1)Πt=2nfRt|Rt-1(Rt=rt|Rt-1=rt-1),
f() sono le distribuzioni delle variabili che ho appena definito, .ie, che definisce f R 1 ( R 1 = r 1 ) = 1σ'2=σw2/[1-φ2]+σt2, e definendoσ2(t)=σ 2 w +σ 2 t -ϕ2σ 2 t - 1 , fRt| Rt-1(Rt=rt|Rt-1=rt-1)=1
fR1(R1=r1)=12πσ'2exp(-r122σ'2),
σ2(t)=σw2+σt2-φ2σt-12
fRt|Rt-1(Rt=rt|Rt-1=rt-1)=12πσ2(t)exp(-(rt-φrt-1)22σ2(t))

3. Domande

  1. La mia derivazione è ok? Non ho risorse da confrontare oltre alle simulazioni (che sembrano concordare) e non sono uno statistico!
  2. MA(1)ARMA(1,1)ARMA(p,q)

Non ho esattamente una soluzione per te. Ma penso che questo sia un tipo di problema con le variabili di errore. Ho visto queste cose nella teoria macroeconomica di Thomas Sergent (libro degli anni '80). Potresti voler dare un'occhiata a quello.
Metriche il

Grazie per l'input, @Metrics. Controllerò il libro!
Néstor,

Risposte:


1
  1. RtRt-1φrt-1φX^t-1X^t-1 è la tua migliore stima di Xdal periodo precedente. Il valore diX^t-1 include informazioni provenienti da precedenti osservazioni e rt-1. (Per vedere questo, considera una situazione in cuiσw e φsono trascurabili, quindi stai effettivamente stimando una media fissa. Dopo molte osservazioni, la tua incertezzaX sarà molto più piccolo di ση.) Questo all'inizio può essere fonte di confusione, perché si osserva R e non X. Ciò significa solo che hai a che fare con un modello di spazio-stato .

  2. Sì, esiste un quadro molto generale per l'utilizzo di modelli lineari gaussiani con osservazioni rumorose, chiamato filtro Kalman . Questo vale per qualsiasi cosa con una struttura ARIMA e molti altri modelli. Variabili nel tempoσηva bene per il filtro Kalman, purché non sia stocastico. I modelli con, ad esempio, la volatilità stocastica richiedono metodi più generali. Per vedere come viene derivato il filtro Kalman, prova Durbin-Koopman o il capitolo 3 di Harvey . Nella notazione di Harvey, il tuo modello haZ=1, d=c=0, Ht=ση,t2, T=φ, R=1 e Q=σw2.


Ciao Jamie, grazie per il tuo contributo. Un paio di commenti: 1. Non ne sono sicuro. È stato, in realtà, il mio primo tentativo come soluzione, ma sia la mia intuizione che le mie simulazioni non sono d'accordo. Il fatto è che in realtà non osservo Xt, Osservo Rt; inoltre, puoi provare (aritmeticamente) che la media condizionale della variabile casualeRt|Rt-1=rt-1 (nota che non lo è Rt|Xt-1=Xt-1) è effettivamente φX^t-1? 2. Puoi approfondire l'applicazione del filtro Kalman a questo particolare problema?
Néstor,

Ciao Nestor, ho modificato la risposta per rispondere ai tuoi commenti. Spero possa aiutare.
Jamie Hall,

Ciao Jamie: riguardo al secondo punto, va bene, grazie :-)! Tuttavia, non riesco ancora a vedere il tuo primo punto. Puoi indicarmi una derivazione formale? In particolare, vorrei sapere quale parte del mio ragionamento è errata (e perché)!
Néstor,

Hai saltato un passaggio: la distribuzione di X1 given R1. It's N(σx,12(σx,12+ση,12)r1,σx,22), where σx,12 is the variance you calculated in the first step, and σx,22 is twice the harmonic mean of σx,12 and ση,12. (This is just like Bayesian updating with two Gaussian pdfs.) Your equation (3) is formally correct, but you're throwing away information by using that instead of p(Xt1|R1:t1).
Jamie Hall

-1

Honestly, you should code this in BUGs or STAN and not worry about it from there. Unless this is a theoretical question.


2
(-1) To this response; this is clearly a theoretical question ;-). Consider improving why you think I should code it in BUGs or STAN and what it does have to do with the original question?
Néstor
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.