Suppongo che tu abbia dimestichezza con il triangolo rettangolo nel senso che E[Y∣X] e Y−E[Y∣X] sono variabili casuali non correlate . Per variabili casuali non correlate A e B ,
var(A+B)=var(A)+var(B),(1)
e quindi se impostiamo
A = Y- E[ Y∣ X] e
B = E[ Y∣ X] modo che
A + B = Y , otteniamo quel
var( Y) = var( Y- E[ Y∣ X] ) + var( E[ Y∣ X] ) .(2)
Resta da mostrare quel
è uguale a
E [ var ( Y ∣ X ) ] in modo che possiamo ri-dichiarare
( 2 ) come
var ( Y ) = E [ var ( Y ∣ X ) ] + var ( E [ Y ∣ X ] )
che è la formula della varianza totale.
var( Y- E[ Y∣ X] )E[ var( Y∣ X) ]( 2 )var( Y) = E[ var( Y∣ X) ] + var( E[ Y∣ X] )(3)
È noto che il valore atteso della variabile casuale è E [ Y ] , cioè E [ E [ Y ∣ X ] ] = E [ Y ] . Quindi vediamo che
E [ A ] = E [ Y - E [ Y ∣ X ] ] = E [ Y ] - E [ E [E[ Y∣ X]E[ Y]E[ E[ Y∣ X] ] = E[ Y]
da cui segue che var ( A ) = E [ A 2 ] , cioè
var ( Y - E [ Y ∣ X ] ) = E [ ( Y - E [ Y ∣ X ] ) 2 ] .
Lascia che C denoti la variabile casuale ( Y - E [ Y
E[ A ] = E[ Y- E[ Y∣ X] ] = E[ Y] - E[ E[ Y∣ X] ] = 0 ,
var( A ) = E[ A2]var( Y- E[ Y∣ X] ) = E[ ( Y- E[ Y∣ X] )2] .(4)
C modo da poter scrivere quel
var ( Y - E [ Y ∣ X ] ) = E [ C ] .
Ma
E [ C ] = E [ E [ C ∣ X ] ] dove
E [ C ∣ X ] = E [ ( Y - E [ Y ∣ X ] )( Y- E[ Y∣ X] )2var( Y- E[ Y∣ X] ) = E[ C] .(5)
E[ C] = E[ E[ C∣ X] ]
Ora,
datoche
X = x , la distribuzione condizionale di
Y ha la media
E [ Y ∣ X = x ]
e quindi
E [ ( Y - E [ Y ∣ X = x ] ) 2 | X = x ] = var ( Y ∣ X = x ) .
In altre parole,
EE[ C∣ X] = E[ ( Y- E[ Y∣ X] )2||X] .X= xYE[ Y∣ X= x ]E[ ( Y- E[ Y∣ X= x ] )2||X= x ] = var( Y∣ X= x ) .
modo che la
variabile casuale E [ C ∣ X ] sia solo
var ( Y ∣ X ) . Quindi,
E [ C ] = E [ E [ C ∣ X ] ] = E [ var ( Y ∣ X ) ] ,E[ C∣ X= x ] = var( Y∣ X= x ) E[ C∣ X]var( Y∣ X)E[ C] = E[ E[ C∣ X] ] = E[ var( Y∣ X) ] ,(6)
che dopo la sostituzione in
mostra che
var ( Y - E [ Y ∣ X ] ) = E [ var ( Y ∣ X ) ] .
Questo rende il lato destro di
( 2 ) esattamente ciò di cui abbiamo bisogno e quindi abbiamo dimostrato la formula della varianza totale
( 3 ) .
( 5 )var( Y- E[ Y∣ X] ) = E[ var( Y∣ X) ] .
( 2 )( 3 )