Legge della varianza totale come teorema di Pitagora


15

Supponiamo che X e Y abbiano un secondo momento finito. Nello spazio di Hilbert di variabili casuali con secondo momento finito (con prodotto interno di T1,T2 definito da , ), possiamo interpretare come la proiezione sullo spazio di funzioni di .E(T1T2)||T||2=E(T2)E(Y|X)YX

Sappiamo anche che la Legge della varianza totale legge

Var(Y)=E(Var(Y|X))+Var(E(Y|X))

C'è un modo per interpretare questa legge in termini di figura geometrica sopra? Mi è stato detto che la legge è la stessa del Teorema di Pitagora per il triangolo rettangolo con i lati . Capisco perché il triangolo è ad angolo retto, ma non come il Teorema di Pitagora sta catturando la Legge della varianza totale.Y,E(Y|X),YE(Y|X)

Risposte:


7

Suppongo che tu abbia dimestichezza con il triangolo rettangolo nel senso che E[YX] e YE[YX] sono variabili casuali non correlate . Per variabili casuali non correlate A e B ,

(1)var(A+B)=var(A)+var(B),
e quindi se impostiamo A=YE[YX] eB=E[YX] modo cheA+B=Y , otteniamo quel
(2)var(Y)=var(YE[YX])+var(E[YX]).
Resta da mostrare quel è uguale a E [ var ( Y X ) ] in modo che possiamo ri-dichiarare ( 2 ) come var ( Y ) = E [ var ( Y X ) ] + var ( E [ Y X ] ) che è la formula della varianza totale.var(YE[YX])E[var(YX)](2)
(3)var(Y)=E[var(YX)]+var(E[YX])

È noto che il valore atteso della variabile casuale è E [ Y ] , cioè E [ E [ Y X ] ] = E [ Y ] . Quindi vediamo che E [ A ] = E [ Y - E [ Y X ] ] = E [ Y ] - E [ E [E[YX]E[Y]E[E[YX]]=E[Y] da cui segue che var ( A ) = E [ A 2 ] , cioè var ( Y - E [ Y X ] ) = E [ ( Y - E [ Y X ] ) 2 ] . Lascia che C denoti la variabile casuale ( Y - E [ Y

E[UN]=E[Y-E[Y|X]]=E[Y]-E[E[Y|X]]=0,
var(UN)=E[UN2]
(4)var(Y-E[Y|X])=E[(Y-E[Y|X])2].
C modo da poter scrivere quel var ( Y - E [ Y X ] ) = E [ C ] . Ma E [ C ] = E [ E [ C X ] ] dove E [ C X ] = E [ ( Y - E [ Y X ] )(Y-E[Y|X])2
(5)var(Y-E[Y|X])=E[C].
E[C]=E[E[C|X]] Ora,datoche X = x , la distribuzione condizionale di Y ha la media E [ Y X = x ] e quindi E [ ( Y - E [ Y X = x ] ) 2 | X = x ] = var ( Y X = x ) . In altre parole, EE[C|X]=E[(Y-E[Y|X])2|X].X=XYE[Y|X=X]
E[(Y-E[Y|X=X])2|X=X]=var(Y|X=X).
modo che lavariabile casuale E [ C X ] sia solo var ( Y X ) . Quindi, E [ C ] = E [ E [ C X ] ] = E [ var ( Y X ) ] ,E[C|X=X]=var(Y|X=X) E[C|X]var(Y|X)
(6)E[C]=E[E[C|X]]=E[var(Y|X)],
che dopo la sostituzione in mostra che var ( Y - E [ Y X ] ) = E [ var ( Y X ) ] . Questo rende il lato destro di ( 2 ) esattamente ciò di cui abbiamo bisogno e quindi abbiamo dimostrato la formula della varianza totale ( 3 ) .(5)
var(Y-E[Y|X])=E[var(Y|X)].
(2)(3)

Y-E(Y|X)vun'r(Y-E(Y|X))=E[Y-E(Y|X)]2Evun'r(Y|X)=E[E((Y-E(Y|X))2|X)]=E[Y-E(Y|X)]2

1
E[(Y-E[Y|X])2]

1
Dilip, molti probabilisti interpreterebbero correttamente l'equazione di @ mpiktas come scritta; il set di parentesi extra viene spesso eliminato. Forse i miei occhi mi stanno ingannando, ma penso che la sua notazione sia coerente in tutto. Sono felice di aiutare a sistemare le cose, se lo si desidera, però. :-)
cardinale

EXEXXEX2

vun'r...

2

dichiarazione:

T1T2T1,T2=0

(1)||T1+T2||2=||T1||2+||T2||2.

Il nostro caso:

T1=E(Y|X)T2=Y-E[Y|X]||Tio||2=E[Tio2]T1,T2=E[T1T2](1)

(2)E[Y2]=E[{E(Y|X)}2]+E[(Y-E[Y|X])2],
E[T1T2]=Cov(T1,T2)=0(2)
  1. (E[Y])2Var[Y]

  2. E[{E(Y|X)}2]-(E[Y])2=Var(E[Y|X])

  3. E[(Y-E[Y|X])2]=E[E{(Y-E[Y|X])2}|X]=E[Var(Y|X)]

Per i dettagli su questi tre punti elenco, consultare il post di @ DilipSarwate. Spiega tutto questo in modo molto più dettagliato di me.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.