Intuizione (geometrica o altro) di


8

In un'altra puntata di intuizioni per identità in probabilità, si consideri la Legge dell'identità elementare della varianza totale

Var(X)=E[Var(X|Y)]+Var(E[X|Y])

È una semplice manipolazione algebrica semplice della definizione di momenti in sommatoria o, come nel collegamento di Wikipedia, tramite la manipolazione di E e Var.

Ma questa identità, non ho idea di cosa significhi . Suppongo che tu possa presumibilmente calcolare la varianza di una variabile usando un'altra variabile per dare una mano, ma non sembra che semplifichi le cose o renda le cose più tracciabili.

La pagina wiki dice

il primo componente è chiamato il valore atteso della varianza del processo (EVPV) e il secondo è chiamato la varianza delle medie ipotetiche (VHM)

che è illuminante quanto può essere la lettura di nomi.

Quindi, che cosa realmente significa ? C'è un'intuizione sulle due parti? Hai bisogno di un'intuizione diE[E[X|Y]]=E[X]primo? Un'intuizione geometrica potrebbe essere piacevole, ma anche una spiegazione prolissa, una piccola algebra, aiuterebbe immensamente.

Esistono buone interpretazioni algebriche lineari o interpretazioni fisiche o altro che possano dare un'idea di questa identità?


4
ma non sembra che semplifichi le cose o le renda più trattabili - è utile praticamente in tutti i casi in cui c'è qualche ausiliarioY quello fa XY più facile da pensare che non solo Xsi. Ad esempio, prendi XYN(Y,Yσ2) e YBinomial(n,p); poi
E[Var(XY)]=E[Yσ2]=npσ2Var(E[XY])=Var(Y)=np(1p).
Cercare di calcolarlo direttamente sarebbe stato molto meno semplice.
Dougal,

Risposte:


5

Per ottenere una semplice intuizione, confronteremo con un'analisi bidirezionale della varianza. PermettereYij=μi+ϵij dove il ϵij sono iid con aspettativa zero e varianza comune σ2, i=1,,k;j=1,,ni.

Quindi abbiamo la decomposizione

i=1kj=1ni(YijY¯¯)2=i=1kj=1ni(YijYi¯)2+i=1kni((Yi¯Y¯¯)2
dove il primo termine sulla giusta misura la varianza all'interno del gruppo (e può essere usato per stimare la varianza all'interno del gruppo σ2), il secondo termine misura la varianza tra i gruppi e può essere utilizzato per stimare σ2 solo con l'ipotesi che tutto il μihanno un valore comune. Altrimenti, conterrà un componente aggiuntivo, la "varianza diμi"s". Ha la stessa forma della legge della varianza totale!

Formalmente, lascia che l'appartenenza al gruppo sia la variabile casuale G. Quindi otteniamo

VarY=EVar(Y|G)+VarE(Y|G)
e possiamo leggerlo come "varianza di Yè il valore atteso della varianza all'interno del gruppo più la varianza delle aspettative del gruppo. "Questo è lo stesso della nostra interpretazione della decomposizione ANOVA sopra. Osservando più da vicino la derivazione (che non abbiamo dato qui) puoi vedere che è davvero una versione del teorema di Pitagora. Per quel punto di vista vedi la Legge della varianza totale come teorema di Pitagora

Il mio hack mathjax per ottenere doppi overline non funziona molto bene. Idee per migliorarlo?
kjetil b halvorsen,

1
Il doppio overline sembra molto meglio con X che con Y per qualche ragione: X¯¯.
jbowman,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.