Puoi dimostrarlo calcolando esplicitamente la densità condizionale per forza bruta, come nel link di Procrastinator (+1) nei commenti. Ma c'è anche un teorema che dice che tutte le distribuzioni condizionali di una distribuzione normale multivariata sono normali. Pertanto, tutto ciò che rimane è calcolare il vettore medio e la matrice di covarianza. Ricordo che l'abbiamo derivato in una classe di serie temporali al college definendo abilmente una terza variabile e usando le sue proprietà per derivare il risultato più semplicemente della soluzione di forza bruta nel collegamento (purché tu sia a tuo agio con l'algebra matriciale). Sto andando dalla memoria ma era qualcosa del genere:
Sia la prima partizione e la seconda. Ora definisci dove . Adesso possiamo scriverex 2 z = x 1 + A x 2 A =- Σ 12 Σ - 1 22x1x2z=x1+Ax2A=−Σ12Σ−122
cov(z,x2)=cov(x1,x2)+cov(Ax2,x2)=Σ12+Avar(x2)=Σ12−Σ12Σ−122Σ22=0
Pertanto e non sono correlati e, poiché sono congiuntamente normali, sono indipendenti . Ora, chiaramente , quindi ne consegue chezx2E(z)=μ1+Aμ2
E(x1|x2)=E(z−Ax2|x2)=E(z|x2)−E(Ax2|x2)=E(z)−Ax2=μ1+A(μ2−x2)=μ1+Σ12Σ−122(x2−μ2)
che dimostra la prima parte. Per la matrice di covarianza, si noti che
var(x1|x2)=var(z−Ax2|x2)=var(z|x2)+var(Ax2|x2)−Acov(z,−x2)−cov(z,−x2)A′=var(z|x2)=var(z)
Ora abbiamo quasi finito:
var(x1|x2)=var(z)=var(x1+Ax2)=var(x1)+Avar(x2)A′+Acov(x1,x2)+cov(x2,x1)A′=Σ11+Σ12Σ−122Σ22Σ−122Σ21−2Σ12Σ−122Σ21=Σ11+Σ12Σ−122Σ21−2Σ12Σ−122Σ21=Σ11−Σ12Σ−122Σ21
che dimostra la seconda parte.
Nota: per coloro che non hanno molta familiarità con l'algebra della matrice qui usata, questa è una risorsa eccellente .
Modifica: una proprietà usata qui non è nel ricettario della matrice (buona cattura @FlyingPig) è la proprietà 6 nella pagina di Wikipedia sulle matrici di covarianza: che è quella per due vettori casuali , Per gli scalari, ovviamente, ma per i vettori sono diversi in quanto le matrici sono disposte diversamente.x,y
var(x+y)=var(x)+var(y)+cov(x,y)+cov(y,x)
cov(X,Y)=cov(Y,X)