Derivazione del normale di Wishart posteriore


11

Sto lavorando alla derivazione di un posteriore di Normal-Wishart ma sono bloccato su uno dei parametri (il posteriore della matrice della scala, vedi in basso).

Solo per contesto e completezza, ecco il modello e il resto delle derivazioni:

xiN(μ,Λ)μN(μ0,(κ0Λ)1)ΛW(υ0,W0)

Le forme espanse di ciascuno dei tre fattori è (fino a una costante di proporzionalità) sono:

  • Probabilità:

    N(xi|μ,Λ)|Λ|N/2exp(12i=1N(xiTΛxi2μTΛxi+μTΛμ))
  • Normale precedente:

    N(μ|(μ0,κ0Λ)1)|Λ|1/2exp(12(μTκ0Λμ2μTκ0Λμ0+μ0Tκ0Λμ0))
  • Wishart precedente:

    W(Λ|υ0,W0)|Λ|υ0D12exp(12tr(W01Λ))

Vogliamo il normale Wishart posteriore ( ) che può essere scomposto come oltre a :μ,Λ|μ,κ,υ,WN(μ|μ,κΛ)W(Λ|υ,W)

Degress of freedomυ

Unendo i primi fattori della probabilità e il Wishart otteniamo il primo fattore del fattore Wishart nella parte posteriore: e quindi abbiamo il primo parametro del posteriore:

|Λ|υ0+ND12
υ=υ0+N

Fattore di scalaκ

Identifichiamo gli elementi racchiusi tra e per scoprire chi è il precedente aggiornato dalla probabilità: e quindi abbiamo ottenuto il secondo parametro: μTμκ0Λ

μT((κ0+N)Λ)μ
κ=κ0+N

Meanμ

Il terzo parametro deriva dall'identificazione di cosa c'è dentro : E quindi abbiamo ottenuto il terzo parametro: 2μT...

2μT(ΛNx¯+κ0Λμ0)=2μTκΛμ(ΛNx¯+κ0Λμ0)=κΛμ(Nx¯+κ0μ0)=κμ
μ=1k(Nx¯+κ0μ0)

Matrice di scalaW

E il quarto parametro deriva dal lavorare sui restanti parametri:

tr(W1Λ)=tr(W01Λ)+i=1NxiTΛxi+μ0Tκ0Λμ0=tr(W01Λ)+i=1Ntr(xiTΛxi)+tr(μ0Tκ0Λμ0)=tr(W01Λ+i=1NxiTΛxi+μ0Tκ0Λμ0)

Come procedere da qui (se non ho fatto errori finora) e ottenere la soluzione standard per ?W

Modifica 1 :

Ora riordiniamo i termini, aggiungiamo e sottraggiamo alcuni fattori per ottenere due quadrati come nella soluzione standard:

tr(W1Λ)=tr(W1Λ+i=1N(xiTΛxi+x¯TΛx¯2xiTΛx¯)+κ0(μ0TΛμ0+x¯TΛx¯2x¯TΛμ0)i=1Nx¯TΛx¯+2i=1NxiTΛx¯κ0x¯TΛx¯+2κ0x¯TΛμ0)=tr(W1Λ+i=1N(xix¯)Λ(xix¯)T+κ0(x¯μ0)Λ(x¯μ0)TNx¯Λx¯T+2Nx¯Λx¯Tκ0x¯Λx¯T+2κ0x¯Λμ0T)

Semplifichiamo i fattori che rimangono fuori dai quadrati:

tr(W1Λ)=tr(W1Λ+i=1N(xix¯)TΛ(xix¯)+κ0(x¯μ0)TΛ(x¯μ0)+(Nκ0)x¯TΛx¯+2κ0x¯TΛμ0)

Modifica 2 ( follow-up grazie alla risposta di @bdeonovic )

La traccia è ciclica, quindi . Quindi: e quindi: tr(ABC)=tr(BCA)=tr(CAB)

tr(W1Λ)=tr(W1Λ+i=1N(xix¯)(xix¯)TΛ+κ0(x¯μ0)(x¯μ0)TΛ+(Nκ0)x¯x¯TΛ+2κ0x¯μ0TΛ)
tr(W1)=tr(W1+i=1N(xix¯)(xix¯)T+κ0(x¯μ0)(x¯μ0)T+(Nκ0)x¯x¯T+2κ0x¯μ0T)

Quasi! Ma ancora non c'è. L'obiettivo è:

W1+i=1N(xix¯)(xix¯)T+κ0Nκ0+N(x¯μ0)(x¯μ0)T

Risposte:


4

La traccia è ciclica, quindi . Anche la traccia si distribuisce sull'addizione in modo che . Con questi fatti dovresti essere in grado di scorrere il termine verso il retro nei termini della traccia, combinare i termini della traccia insieme. Il risultato dovrebbe essere simile atr(ABC)=tr(BCA)=tr(CAB)tr(A+B)=tr(A)+tr(B)Λ

W1=W1+i=1Nxixi+μ0μ0

Grazie! tuttavia, non vedo come ottenere da lì i risultati standard ( en.wikipedia.org/wiki/Conjugate_prior ) che contiene e . Non ho nemmeno segni negativi: O(xix¯)x¯μ0
Alberto

3

La probabilità precedente è ×

|Λ|N/2exp{12(i=1NxiTΛxiNx¯TΛμμTΛNx¯+NμTΛμ)}×|Λ|(ν0D1)/2exp{12tr(W01Λ)}×|Λ|1/2exp{κ02(μTΛμμTΛμ0μ0TΛμ+μ0TΛμ0)}.
Questo può essere riscritto come Possiamo riscrivere
|Λ|1/2|Λ|(ν0+ND1)/2×exp{12((κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ))}
(κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ)
come segue aggiungendo e sottraendo un termine:
(κ0+N)μTΛμμTΛ(κ0μ0+Nx¯)(κ0μ0+Nx¯)TΛμ+1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ).
Le prime due linee ora sono scomposte come
(κ0+N)(μκ0μ+Nx¯κ0+N)TΛ(μκ0μ+Nx¯κ0+N).

Aggiunta e sottrazione di , la seguente: può essere riscritto come Nx¯TΛx¯

1κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+κ0μ0TΛμ0+i=1NxiTΛxi+tr(W01Λ)
i=1N(xiTΛxixiTΛx¯x¯TΛxi+x¯TΛx¯)+Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)+tr(W01Λ).
Il termine somma
i=1N(xiTΛxixiTΛx¯x¯TΛxi+x¯TΛx¯)
uguale a Ora può essere espanso come
i=1N(xix¯)TΛ(xix¯).
Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ0μ0+Nx¯)TΛ(κ0μ0+Nx¯)
Nx¯TΛx¯+κ0μ0TΛμ01κ0+N(κ02μ0TΛμ0+Nκ0μ0TΛx¯0+Nκ0x¯TΛμ0+N2x¯TΛx¯),
che è uguale
Nκ0κ0+N(x¯TΛx¯x¯TΛμ0μ0TΛx¯+μ0TΛμ0)=Nκ0κ0+N(x¯μ0)TΛ(x¯μ0).

I seguenti due termini sono scalari: E qualsiasi scalare è uguale alla sua traccia, quindi

i=1N(xix¯)TΛ(xix¯),Nκ0κ0+N(x¯μ0)TΛ(x¯μ0).
tr(W01Λ)+i=1N(xix¯)TΛ(xix¯)+Nκ0κ0+N(x¯μ0)TΛ(x¯μ0)
può essere riscritto come Poiché , la somma sopra è uguale
tr(W01Λ)+tr(i=1N(xix¯)TΛ(xix¯))+tr(Nκ0κ0+N(x¯μ0)TΛ(x¯μ0)).
tr(ABC)=tr(CAB)
tr(W01Λ)+tr(i=1N(xix¯)(xix¯)TΛ)+tr(Nκ0κ0+N(x¯μ0)(x¯μ0)TΛ).
Utilizzando il fatto che , possiamo riscrivere la somma come tr(A+B)=tr(A)+tr(B)
tr(W01Λ+i=1N(xix¯)(xix¯)TΛ+Nκ0κ0+N(x¯μ0)(x¯μ0)TΛ)=tr((W01+i=1N(xix¯)(xix¯)T+Nκ0κ0+N(x¯μ0)(x¯μ0)T)Λ).

Mettendo tutto insieme, se lasciamo abbiamo che la probabilità precedente è uguale S=i=1N(xix¯)(xix¯)T×

|Λ|1/2exp{κ0+N2(μκ0μ+Nx¯κ0+N)TΛ(μκ0μ+Nx¯κ0+N)}×|Λ|(ν0+ND1)/2exp{12tr((W01+S+Nκ0κ0+N(x¯μ0)(x¯μ0)T)Λ)},
come richiesto.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.