Con le distribuzioni sui nostri vettori casuali:
xi|μ∼N(μ,Σ)
μ∼N(μ0,Σ0)
Secondo la regola di Bayes la distribuzione posteriore è simile a:
p(μ|{xi})∝p(μ)∏Ni=1p(xi|μ)
Così:
lnp(μ|{xi})=−12∑Ni=1(xi−μ)′Σ−1(xi−μ)−12(μ−μ0)′Σ−10(μ−μ0)+const
=−12Nμ′Σ−1μ+∑Ni=1μ′Σ−1xi−12μ′Σ−10μ+μ′Σ−10μ0+const
=−12μ′(NΣ−1+Σ−10)μ+μ′(Σ−10μ0+Σ−1∑Ni=1xi)+const
=−12(μ−(NΣ−1+Σ−10)−1(Σ−10μ0+Σ−1∑Ni=1xi))′(NΣ−1+Σ−10)(μ−(NΣ−1+Σ−10)−1(Σ−10μ0+Σ−1∑Ni=1xi))+const
Qual è la densità del tronco di un gaussiano:
μ|{xi}∼N((NΣ−1+Σ−10)−1(Σ−10μ0+Σ−1∑Ni=1xi),(NΣ−1+Σ−10)−1)
Utilizzando l'identità di Woodbury sulla nostra espressione per la matrice di covarianza:
(NΣ−1+Σ−10)−1=Σ(1NΣ+Σ0)−11NΣ0
Il che fornisce la matrice di covarianza nella forma desiderata dall'OP. Usando questa espressione (e la sua simmetria) ulteriormente nell'espressione per la media abbiamo:
Σ(1NΣ+Σ0)−11NΣ0Σ−10μ0+1NΣ0(1NΣ+Σ0)−1ΣΣ−1∑Ni=1xi
=Σ(1NΣ+Σ0)−11Nμ0+Σ0(1NΣ+Σ0)−1∑Ni=1(1Nxi)
Qual è il modulo richiesto dall'OP per la media.