Diverse rappresentazioni dello spazio degli stati per Auto-Regressione e filtro Kalman


8

Vedo che esistono diversi modi per scrivere un modello AR in una rappresentazione dello spazio degli stati, in modo da poter applicare il filtro Kalman per stimare il segnale. Vedi gli esempi 1, 2 e 3 qui .

Mi chiedo quali differenze ci siano tra le diverse rappresentazioni dello spazio degli stati sulla stima del filtro Kalman?

Grazie!


Questo è il posto giusto per questo, non la scienza computazionale . Se non hai ottenuto risposte, prova ad aggiornare il post che mostra i tuoi sforzi la settimana scorsa: hai provato a ricercare te stesso? Un'altra opzione è l'aggiunta di una taglia ...
Lorem Ipsum

La discussione sembra essere più teorica che qui. Il filtro Kalman è un metodo di stima ottimale per un sistema dinamico stocastico. Quindi si adatta perfettamente alla scienza computazionale. Non ho ancora trovato nulla di utile.
Tim

hai provato a piazzare una taglia? Devi solo prestare maggiore attenzione alla tua domanda e ci sono modi per farlo ...
Lorem Ipsum,

Risposte:


8

Sfortunatamente non so molto sui filtri di Kalman, ma penso di poterti aiutare con le cose dello spazio degli stati.

Nell'esempio 1, il modello AR è esattamente la tua vecchia definizione ricorsiva di output DSP:

yt=α+ϕ1yt1+ϕ2yt2+ηt

In questo caso scriviamo il modello dello spazio degli stati con corrispondenza diretta con l'equazione sopra:

(ytyt1)=(ϕ1ϕ210)(yt1yt2)+(α0)+(10)ηt

Si noti che in questo caso, gli stati del sistema sono valori correnti e precedenti dell'output.

Nel secondo esempio, stai separando i tuoi stati cdai tuoi valori di output. Ciò significa che gli stati possono ora essere qualsiasi cosa, anche se continuano a mappare direttamente sui valori di output. In questo modo otteniamo

yt=μ+ct

ct=ϕ1ct1+ϕ2ct2+ηt

E quindi

(ctct1)=(ϕ1ϕ210)(ct1ct2)+(10)ηt

Dovresti anche riconoscerlo come rappresentazione standard dello spazio di stato di un sistema lineare, perché le equazioni per l'evoluzione dello stato e l'output dipendente dallo stato sono due equazioni diverse . Questa separazione è banale nel caso di un modello AR, ma quest'ultima notazione è il modo in cui pensiamo a tutti i modelli lineari di spazio-stato in generale.

Il terzo esempio è curioso. Se moltiplichi tutti i coefficienti, ti renderai conto che è effettivamente equivalente al primo e al secondo esempio. Allora perché farlo? Risulta che l'esempio 2 (essendo la rappresentazione dello spazio degli stati corretta del sistema) è chiamato la Forma canonica controllabile di questo sistema. Se fai qualche lettura o semplicemente analizzi attentamente il sistema, ti renderai conto che possiamo mettere questo sistema in qualsiasi stato per cui ci piace fornire valori ben educati perϕ1 e ϕ2 con il singolo input α. Perciò chiamiamo tali sistemi controllabili ed è molto facile vedere da questa forma delle equazioni dello spazio degli stati.

Dovresti notare che due sistemi lineari possono essere identici fino a un cambio di base. Ciò significa che possiamo scegliere una base diversa per rappresentare lo stesso sistema lineare. Puoi convincerti che è esattamente quello che abbiamo fatto per passare dal secondo al terzo esempio. In particolare, ci piace questa trasformazione lineare per trasporre la matrice di transizione di stato, in modo da ottenere uno stato sconosciutos

yt=(10)αt

αt=(stst1)=(ϕ1ϕ210)(st1st2)+(α0)+(10)ηt

Ora possiamo usare il cambio di base per scoprire cosa sia questo stato s deve essere rispetto allo stato y. E possiamo calcolarlo

(stst1)=(ytϕ2yt1)

Questa forma (trasposizione della forma canonica di controllabilità) è chiamata forma canonica di osservabilità perché se possiamo mettere un sistema in questa forma, possiamo facilmente dedurre quali stati del sistema possono essere osservati semplicemente guardando l'output. Per una descrizione dei moduli canonici, puoi leggere questo documento e, naturalmente, guardarti intorno sul web. Si noti che nel documento gli stati sono capovolti, il che non cambia nulla sulla rappresentazione del sistema, semplicemente riordinando le righe / colonne delle matrici.


2

In breve, tutto dipende da cosa stai cercando di stimare, cioè da ciò che sai del segnale e da cosa non fai. Il filtro di Kalman cercherà di valutare lo stato in base a vostra definizione di ciò che stato è. Il problema convenzionale è quando stiamo cercando di stimare i coefficienti AR.

Facciamo un esempio di un AR(2) modello senza termine costante μ.

yk=a1yk1+a2yk2+ηk

Per stimare il sistema sopra, tutto ciò che devi fare è stimare i coefficienti AR, a1 e a2.

Impostazione generale dello spazio dello stato del filtro Kalman:

xk=Fk1xk1+wk
yk=Hkxk+vk
wk=WGN(0,Qs) e vk=WGN(0,Qo)

In questo caso, dobbiamo stimare a1 e a2. Quindi è naturale impostare lo stato come questi coefficienti.xk=[a1,a2]T Per questo esempio, questi coefficienti sono costanti (Fk=Fk1=I) e non vi è alcun rumore in questi coefficienti - - wk=0Qs=0.

Dal momento che tutto ciò che osserviamo è yk, diventano le misure per il nostro sistema. Dato che abbiamo già definito quale sia il vettore di stato, affinché le nostre equazioni di misura siano uguali al modello AR dato, sostituiamo il nostro rumore di misuravk con ηk e Hk=[yk1,yk2].

xk=xk1=[a1a2]
yk=Hkxk+ηk=[yk1yk2][a1a2]+ηk

Ora puoi usare il filtro Kalman per stimare il tuo stato e di conseguenza il tuo segnale.

Nota: l'unica cosa strana qui è la tua matrice Hk dipende dalle tue misure yk. Alcune persone hanno l'idea sbagliata che i guadagni di Kalman e la matrice di covarianza di stato siano sempre indipendenti dalle misurazioni e che possano essere calcolati in anticipo. Questo caso mostra chiaramente che non è così. Sia il Kalman Gain che lo State Covariance Matrix sono stimati con funzioni di Hk, che in questo caso dipende dalla misurazione.


Non sono d'accordo. Penso che tu comprometta l'osservabilità dello stato includendo la misurazione nella matrice
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.