Stima dei parametri LogLikelihood per il filtro Kalman gaussiano lineare

Ho scritto un codice in grado di eseguire il filtraggio di Kalman (utilizzando un numero di diversi filtri di tipo Kalman [Information Filter et al.]) Per l'analisi dello spazio di stato gaussiano lineare per un vettore di stato n-dimensionale. I filtri funzionano alla grande e sto ottenendo un bel risultato. Tuttavia, la stima dei parametri tramite la stima della responsabilità civile mi confonde. Non sono uno statistico ma un fisico, quindi per favore sii gentile.

Consideriamo il modello lineare dello spazio statale gaussiano

y_{t} = Z_{t} α_{t} + ϵ_{t},

$y_t = \mathbf{Z}_{t}\alpha_{t} + \epsilon_{t},$

α_{t + 1} = T_{t} α_{t} + R_{t} η_{t},

$\alpha_{t + 1} = \mathbf{T}_{t}\alpha_{t} + \mathbf{R}_{t}\eta_{t},$

dove $y_{t}$ è il nostro vettore di osservazione, $\alpha_{t}$ nostro vettore di stato nella fase temporale $t$ . Le quantità in grassetto sono le matrici di trasformazione del modello dello spazio degli stati che sono impostate in base alle caratteristiche del sistema in esame. Abbiamo anche

ϵ_{t} \sim N I D (0, H_{t}),

$\epsilon_{t} \sim NID(0, \mathbf{H}_{t}),$

η_{t} \sim N I D (0, Q_{t}),

$\eta_{t} \sim NID(0, \mathbf{Q}_{t}),$

α_{1} \sim N I D (a_{1}, P_{1}) .

$\alpha_{1} \sim NID(a_{1}, \mathbf{P}_{1}).$

dove . Ora, ho derivato e implementato la ricorsione per il filtro Kalman per questo modello di spazio di stato generico indovinando i parametri iniziali e le matrici di varianza e che posso produrre grafici come $t = 1,\ldots, n$ $\mathbf{H}_{1}$ $\mathbf{Q}_{1}$

Filtro Kalman

dove i punti sono i livelli delle acque del Nilo per gennaio per oltre 100 anni, la linea è lo stato stimato di Kalamn e le linee tratteggiate sono i livelli di confidenza del 90%.

Ora, per questo set di dati 1D le matrici e sono rispettivamente solo scalari e . Quindi ora voglio ottenere i parametri corretti per questi scalari usando l'output del filtro Kalman e la funzione loglikelihood $\mathbf{H}_{t}$ $\mathbf{Q}_{t}$ $\sigma_{\epsilon}$ $\sigma_{\eta}$

\log L (Y_{n}) = - \frac{n p}{2} \log (2 π) - \frac{1}{2} \sum_{t = 1}^{n} (l o g | F_{t} | + v_{t}^{T} F_{t}^{- 1} v_{t})

$\log L(Y_{n}) = -\frac{np}{2}\log(2\pi) - \frac{1}{2}\sum^{n}_{t = 1}(log|\mathbf{F}_{t}| + v^{\mathsf{T}}_{t}\mathbf{F}_{t}^{-1}v_{t})$

Dove è l'errore di stato e è la varianza dell'errore di stato. Ora, ecco dove sono confuso. Dal filtro di Kalman, ho tutte le informazioni di cui ho bisogno per capire , ma questo non mi sembra più vicino a poter calcolare la massima probabilità di e . La mia domanda è come posso calcolare la massima verosimiglianza di e usando l'approccio loglikelihood e l'equazione sopra? Una rottura algoritmica sarebbe come una birra fredda per me in questo momento ... $v_{t}$ $\mathbf{F}_{t}$ $L$ $\sigma_{\epsilon}$ $\sigma_{\eta}$ $\sigma_{\epsilon}$ $\sigma_{\eta}$

Grazie per il tuo tempo.

Nota. Per il caso 1D e . Questo è il modello univariato a livello locale. $\mathbf{H}_{t} = \sigma^{2}_{\epsilon}$ $\mathbf{H}_{t} = \sigma^{2}_{\eta}$

— MoonKnight
fonte

Quando esegui il filtro Kalman come hai, con i valori indicati di e , ottieni una sequenza di innovazioni e le loro covarianze , quindi puoi calcolare il valore del $\sigma_\epsilon^2$ $\sigma^2_\eta$ $\nu_t$ $\boldsymbol{F_t}$ $\log L(Y_n)$ usando la formula che dai.

In altre parole, puoi considerare il filtro Kalman come un modo per calcolare una funzione implicita di e . L'unica cosa che devi fare quindi è impacchettare questo calcolo in una funzione o subroutine e gestire quella funzione in una routine di ottimizzazione - come in R. Quella funzione dovrebbe accettare come input e e restituire il . $\sigma_\epsilon^2$ $\sigma^2_\eta$ optim $\sigma_\epsilon^2$ $\sigma^2_\eta$ $\log L(Y_n)$

Alcuni pacchetti in R (ad es. dlm) Lo fanno per te (vedi ad esempio la funzione dlmMLE).

— F. Tusell
fonte

Grazie per la tua risposta. Apprezzo che sembro avere tutti i componenti richiesti per calcolare esplicitamente la loglikelihood, tuttavia tutti i riferimenti che ho sembrano suggerire che io uso

come incognite nella funzione loglikelihood e massimizzare questo usando un metodo di tipo Newton? Questo è ciò che mi confonde; "La loglikelihood è massimizzata numericamente rispetto al vettore di stato sconosciuto" - come?

σ_{ϵ}

$\sigma_\epsilon$

σ_{η}

$\sigma_\eta$

— MoonKnight,

Il calcolo della probabilità non è così esplicito, in quanto

non compaiono esplicitamente nell'espressione del

. Piuttosto, influenzano la probabilità tramite

. Pertanto, è necessario eseguire il filtro Kalman per calcolare il

per ogni coppia di valori di

. Una volta che lo codifichi sotto forma di una funzione, la gestisci con una funzione di ottimizzazione di tipo Newton (o qualsiasi altra funzione generica) e il gioco è fatto.

σ_{ϵ}

$\sigma_\epsilon$

σ_{η}

$\sigma_\eta$

\log L (Y_{n})

$\log L(Y_n)$

ν_{t}

$\nu_t$

F_{t}

$\boldsymbol{F_t}$

\log L (Y_{n})

$\log L(Y_n)$

σ_{ϵ}

$\sigma_\epsilon$

σ_{η}

$\sigma_\eta$

— F. Tusell,

Mi capita di avere un codice dettagliato (in R) che mostra come farlo esattamente per i dati del Nilo. Lo uso come illustrazione per i miei studenti. Purtroppo è in spagnolo, ma spero che il codice sia abbastanza chiaro (e posso tradurre i commenti in caso contrario). Puoi prendere questo esempio da et.bs.ehu.es/~etptupaf/N4.html .

— F. Tusell,

Questo è di grande aiuto. Grazie mille per il tuo tempo. Il tuo commento ha aiutato molto! A volte è difficile "vedere il bosco per gli alberi" e avere qualcosa di semplice spiegato esplicitamente è tutto ciò che serve ... Grazie ancora.

— MoonKnight,

Vorrei anche chiedere se potevo dare un'occhiata alla pagina in cui si passa attraverso la ricorsione dello stato. Il tuo smoothing sembra migliore del mio e non sono sicuro del perché !? Ho tentato di trovarlo dal tuo sito web ma non riesco a trovare la pagina richiesta ...

— MoonKnight