Stima della distribuzione posteriore della covarianza di un gaussiano multivariato


15

Devo "imparare" la distribuzione di un gaussiano bivariato con pochi campioni, ma una buona ipotesi sulla distribuzione precedente, quindi vorrei usare l'approccio bayesiano.

Ho definito il mio precedente:

P(μ)N(μ0,Σ0)
μ0=[00]   Σ0=[160027]

E la mia distribuzione data l'ipotesi

P(x|μ,Σ)N(μ,Σ)
μ=[00]   Σ=[180018]

Ora so grazie a questo che per stimare la media dati i dati

P(μ|x1,,xn)N(μ^n,Σ^n)

Posso calcolare:

μ^n=Σ0(Σ0+1nΣ)1(1ni=1nxi)+1nΣ(Σ0+1nΣ)1μ0

Σ^n=1nΣ0(Σ0+1nΣ)1Σ

Ora arriva la domanda, forse mi sbaglio, ma mi sembra che Σn sia solo la matrice di covarianza per il parametro stimato μn e non la covarianza stimata dei miei dati. Quello che vorrei sarebbe anche calcolare

P(Σn1|x1,,xn)

per avere una distribuzione completamente specificata appresa dai miei dati.

È possibile? È già risolto calcolando ed è semplicemente espresso nel modo sbagliato la formula sopra (o sto semplicemente fraintendendola)? I riferimenti sarebbero apprezzati. Molte grazie.Σn

MODIFICARE

Dai commenti è emerso che il mio approccio era "sbagliato", nel senso che stavo assumendo una costante covarianza, definita da . Ciò di cui ho bisogno sarebbe di mettere un precedente anche su di esso, , ma non so quale distribuzione dovrei usare, e successivamente qual è la procedura per aggiornarlo.P ( Σ )ΣP(Σ)


Hai già specificato la covarianza dei tuoi dati come - e non hai specificato una distribuzione precedente per aggiornarla a partire dal? Σ=[180018]
Corone,

Vedo il tuo punto. Quindi, con il mio approccio, ho praticamente supposto che la varianza fosse costante e specificata. Se voglio stimarlo, ho bisogno di un precedente. Ora, il mio problema è che non è chiaro come definirlo e quale sarebbe una distribuzione appropriata per esso, ma questo sembra essere al di fuori del campo di applicazione della prima domanda. P(Σ)F(μΣ,ΣΣ)
unziberla,

Quindi cambia la domanda :-)
Corone,

Risposte:


11

Puoi fare l'aggiornamento bayesiano per la struttura della covarianza più o meno nello stesso spirito in cui hai aggiornato la media. Il coniugato precedente per la matrice di covarianza del normale multivariato è la distribuzione di Inverse-Wishart, quindi ha senso iniziare da lì,

P(Σ)W1(Ψ,ν)

Quindi quando ottieni il campione di lunghezza n puoi calcolare la stima della covarianza del campione Σ X = 1XnΣX=1n(Xμ)(Xμ)

Questo può quindi essere utilizzato per aggiornare la stima della matrice di covarianza

P(Σ|X)W1(nΣX+Ψ,n+ν)

Puoi scegliere di utilizzare la media di questo come stima del punto per la covarianza (stima media posteriore)

E[Σ|X]=nΣX+Ψν+np1

oppure potresti scegliere di utilizzare la modalità (Massimo A Posteriore stimatore)

Mode[Σ|X]=nΣX+Ψν+n+p+1


Molte grazie. Ora suppongo che qualcosa cambierà nel mio processo di stima. Come primo passo, dovrei stimare la covarianza Σ con il procedimento, quindi la mia distribuzione data l'ipotesi stimata woulb essere P ( X | u , Σ ) e poiché Σ è stimato e ha una propria distribuzione Sono abbastanza sicuro che questo in qualche modo cambiare il mio precedente formula per calcolare μ n (come accade su gaussiana MLE quando si utilizza la varianza del campione). Σ^P(X|μ,Σ^)Σ^μ^n
unziberla,

L'approccio che descrivi sarebbe invece di usare Σ = E [ Σ | x 1 ... x n ] in modo che io abbia un valore effettivo per la covarianza, come se l'avessi saputo prima. In un approccio frequentista, questo sembrerebbe sbagliato, ma forse c'è qualcosa che mi manca dal fatto che presumo sia noto il precedente e questo rende la procedura corretta? Σ^=E[Σ|x1xn]
unziberla,

7

Ok, ho trovato la vera soluzione al mio problema. Lo sto pubblicando anche se la risposta corretta alla mia domanda (fuori posto) è quella selezionata.

Fondamentalmente, la mia domanda spiega come stimare la media conoscendo la covarianza e la risposta su come stimare la covarianza conoscendo la media. Ma il mio vero problema era stimare con entrambi i parametri sconosciuti.

Ho trovato la risposta su Wikipedia con la derivazione spiegata qui . Il precedente coniugato della normale multivariata è il normale-Wishart inverso, che è fondamentalmente una distribuzione sulle normali multivariate.

I parametri precedenti che devono essere specificati sono per definire la media, Ψ per definire la covarianza, e due valori scalari κ 0 e ν 0 che direi definiscono quanto siamo fiduciosi sulla stima dei primi due parametri rispettivamente.μ0Ψκ0ν0

La distribuzione aggiornata dopo aver osservato campioni di una p -variata normale ha la formanp

P(μ,Σ|X)NIW(κ0μ0+nx¯κ0+n,κ0+n,ν0+n,Ψ+C+κ0nκ0+n(x¯μ0)(x¯μ0)T)

dove

x¯=1ni=0nxi

C=i=1n(xix¯)(xix¯)T

quindi i miei parametri stimati desiderati sono

E(Σ|X)=Ψ+C+κ0n

E(μ|X)=κ0μ0+nx¯κ0+n
E(Σ|X)=Ψ+C+κ0nκ0+n(x¯μ0)(x¯μ0)Tν0+np1
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.