Varianza del prodotto delle variabili dipendenti


32

Qual è la formula per la varianza del prodotto delle variabili dipendenti?

Nel caso di variabili indipendenti la formula è semplice:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2
Ma qual è la formula per le variabili correlate?

A proposito, come posso trovare la correlazione basata sui dati statistici?

Risposte:


32

Bene, usando l'identità familiare che hai sottolineato,

var(XY)=E(X2Y2)E(XY)2

Utilizzando la formula analoga per la covarianza,

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

e

E(XY)2=[cov(X,Y)+E(X)E(Y)]2

il che implica che, in generale, può essere scritto comevun'r(XY)

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

Si noti che nel caso dell'indipendenza, e questo si riduce acov(X2,Y2)=cov(X,Y)=0

[vun'r(X)+E(X)2][vun'r(Y)+E(Y)2]-[E(X)E(Y)]2

e i due termini annullano e ottieni[E(X)E(Y)]2

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

come hai sottolineato sopra.

Modifica: se tutto ciò che osservi è e non e separatamente, allora non penso che ci sia un modo per stimare o tranne in casi speciali (ad esempio, se hanno mezzi noti a priori )X Y c o v ( X , Y ) c o v ( X 2 , Y 2 ) X , YXYXYcov(X,Y)cov(X2,Y2)X,Y


2
perché metti [var (X) + E (X) 2] ⋅ [var (Y) + E (Y) 2] invece di E (X2) E (Y2) ???

1
@ user35458, così può finire con l'equazione come espressione di var (X) e var (Y), quindi paragonabile all'affermazione di OP. Si noti che E (X ^ 2) = Var (X) + E (X) ^ 2.
Waldir Leoncio

2
Al fine di rispondere (offline) a una sfida ormai cancellata alla validità di questa risposta, ho confrontato i suoi risultati con il calcolo diretto della varianza del prodotto in molte simulazioni. Non è una formula pratica da usare se puoi evitarlo, perché può perdere una sostanziale precisione attraverso la cancellazione nel sottrarre un termine ampio da un altro - ma non è questo il punto. Una trappola da tenere presente è che questa domanda riguarda variabili casuali. I suoi risultati si applicano ai dati a condizione che si calcolino varianze e covarianze utilizzando denominatori di anziché di n - 1nn1 (come di consueto per il software).
whuber

14

Questa è un'aggiunta alla bella risposta di @ Macro che espone esattamente ciò che è necessario sapere per determinare la varianza del prodotto di due variabili casuali correlate. Dal dovecov(X,Y),E[X],E[Y],E

(1)var(XY)=E[(XY)2](E[XY])2=E[(XY)2](cov(X,Y)+E[X]E[Y])2(2)=E[X2Y2](cov(X,Y)+E[X]E[Y])2(3)=(cov(X2,Y2)+E[X2]E[Y2])(cov(X,Y)+E[X]E[Y])2
cov(X,Y)E[X]E[Y] ed E [ Y 2 ] possono essere considerati quantità note, dobbiamo essere in grado di determinare il valore di E [ X 2 Y 2 ] in ( 2 ) o cov ( X 2 , Y 2 ) in ( 3 ) . Questo non è facile da fare in generale, ma, come già sottolineato, se X e Y sonovariabili casualiindipendenti, allora cov ( X ,E[X2]E[Y2]E[X2Y2](2)cov(X2,Y2)(3)XY . In effetti, ladipendenza,non la correlazione (o la mancanza di essa) è la questione chiave. Il fatto che sappiamo che cov ( X , Y ) è uguale a 0 invece di un valore diverso da zero nonaiuta,da solo, aminimizzare i nostri sforzi nel determinare il valore di E [ X 2 Y 2 ] o cov ( X 2 , Y 2 ) anche se cov(X,Y)=cov(X2,Y2)=0cov(X,Y)0E[X2Y2]cov(X2,Y2)non semplificare il lato destro e ( 3 ) un po '.(2)(3)

Quando e Y sono variabili casuali dipendenti , quindi in almeno un caso speciale (abbastanza comune o abbastanza importante), è possibile trovare il valore di E [ X 2 Y 2 ] in modo relativamente semplice.XYE[X2Y2]

Supponiamo che e Y siano variabili casuali normali congiuntamente con coefficiente di correlazione ρ . Quindi, condizionata su X = x , la densità condizionale di Y è una densità normale con media E [ Y ] + ρ XYρX=XYe varianzavar(Y)(1-ρ2). Pertanto, E[X2Y2X]E[Y]+ρvar(Y)var(X)(X-E[X])var(Y)(1-ρ2) che è unafunzionequarticadiX, diciamog(X), e la Legge delle aspettative iterate ci dice che E[X2Y2]=E[E[X2Y2X]]=E[g(X)]

E[X2Y2|X]=X2E[Y2|X]=X2[var(Y)(1-ρ2)+(E[Y]+ρvar(Y)var(X)(X-E[X]))2]
Xg(X)
(4)E[X2Y2]=E[E[X2Y2|X]]=E[g(X)]
dove il lato destro di può essere calcolato dalla conoscenza del 3o e 4o momento di X - risultati standard che possono essere trovati in molti testi e libri di consultazione (il che significa che sono troppo pigro per cercarli e includerli in questa risposta).(4)X

XY

(5)Var[xy]=(E[x])2Var[y]+(E[y])2Var[x]+2E[x]Cov[x,y2]+2E[y]Cov[x2,y]+2E[x]E[y]Cov[x,y]+Cov[x2,y2](Cov[x,y])2
Cov[x2,y2]E[(xE[x])2(yE[y])2]Cov[x2,y]Cov[x,y2]

E(X2Y2)
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.