La linearità della varianza


16

Penso che le seguenti due formule siano vere:

Vun'r(un'X)=un'2Vun'r(X)
mentre a è un numero costante
Vun'r(X+Y)=Vun'r(X)+Vun'r(Y)
seX ,Y sono indipendenti

Tuttavia, non sono sicuro di cosa non vada di seguito:

Vun'r(2X)=Vun'r(X+X)=Vun'r(X)+Vun'r(X)
che non è uguale a22Vun'r(X) , cioè4Vun'r(X) .

Se si assume che X è il campione prelevato da una popolazione, penso che possiamo sempre supporre X di essere indipendente dalle altre X s.

Quindi cosa c'è di sbagliato nella mia confusione?


8
La varianza non è lineare - la tua prima affermazione mostra questo (se lo fosse, avresti . La covarianza invece è bilineare.Var(aX)=aVar(X)
Batman

Risposte:


33

Il problema con il tuo ragionamento è

"Penso che possiamo sempre presumere che sia indipendente dalle altre X ".XX

non è indipendente da X . Il simbolo X viene utilizzato per fare riferimento alla stessa variabile casuale qui. Una volta che conosci il valore della prima X da visualizzare nella tua formula, questo risolve anche il valore della seconda X da visualizzare. Se si desidera che facciano riferimento a variabili casuali distinte (e potenzialmente indipendenti), è necessario indicarle con lettere diverse (ad es. X e Y ) o utilizzare pedici (ad es. X 1 e X 2 ); quest'ultimo è spesso (ma non sempre) utilizzato per indicare le variabili tratte dalla stessa distribuzione.XXXXXXYX1X2

Se due variabili e Y sono indipendenti, allora Pr ( X = un | Y = b ) è lo stesso di Pr ( X = una ) : conoscere il valore di Y non ci dà ulteriori informazioni sul valore di X . Ma Pr ( X = a | X = b ) è 1 se a = b e 0 altrimenti: conoscendo il valore di XXYPr(X=a|Y=b)Pr(X=a)YXPr(X=a|X=b)1a=b0Xti dà informazioni complete circa il valore di . [È possibile sostituire le probabilità in questo paragrafo con funzioni di distribuzione cumulativa o, se del caso, funzioni di densità di probabilità, essenzialmente allo stesso effetto.]X

Un altro modo di vedere le cose è che se due variabili sono indipendenti allora hanno una correlazione zero (sebbene la correlazione zero non implichi indipendenza !) Ma è perfettamente correlato con se stesso, Corr ( X , X ) = 1 quindi X non può essere indipendente di se stesso. Si noti che poiché la covarianza è data da Cov ( X , Y ) = Corr ( X , Y ) XCorr(X,X)=1X , quindiCov(X,X)=1Cov(X,Y)=Corr(X,Y)Var(X)Var(Y)

Cov(X,X)=1Var(X)2=Var(X)

La formula più generale per la varianza di una somma di due variabili casuali è

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

In particolare, , quindiCov(X,X)=Var(X)

Var(X+X)=Var(X)+Var(X)+2Var(X)=4Var(X)

che è lo stesso che avresti dedotto dall'applicazione della regola

Var(aX)=a2Var(X)Var(2X)=4Var(X)

Se sei interessato alla linearità, allora potresti essere interessato alla bilinearità della covarianza. Per le variabili casuali , X , Y e Z (dipendenti o indipendenti) e le costanti a , b , c e d che abbiamoWXYZabcd

Cov(aW+bX,Y)=aCov(W,Y)+bCov(X,Y)

Cov(X,cY+dZ)=cCov(X,Y)+dCov(X,Z)

e nel complesso,

Cov(aW+bX,cY+dZ)=acCov(W,Y)+adCov(W,Z)+bcCov(X,Y)+bdCov(X,Z)

È quindi possibile utilizzare questo per dimostrare i risultati (non lineari) per la varianza che hai scritto nel tuo post:

Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)

Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y)

The latter gives, as a special case when a=b=1,

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

When X and Y are uncorrelated (which includes the case where they are independent), then this reduces to Var(X+Y)=Var(X)+Var(Y). So if you want to manipulate variances in a "linear" way (which is often a nice way to work algebraically), then work with the covariances instead, and exploit their bilinearity.


1
Yes! I think you pinpointed at the beginning that the confusion was essentially a notational one. I found it very helpful when one book (very explicitly, some might say laboriously) explained the interpretation of and rules of evaluating a probabilistic statement (so that, e.g., even if you know what you mean by Pr(X+X=n) where XUniform(1..6), it is technically incorrect if you're considering throwing a n in craps (and X+X=2X would never yield an odd roll); the event would be properly expressed using X1,X2 i.i.d.).
Vandermonde

1
This is in contrast to (and I think my misapprehension might have stemmed from) how 2+PRNG(6)+PRNG(6) often is how you would toss dice as above and/or notation/conventions such as 2d6=d6+d6 in which different instances are genuinely intended to be independent.
Vandermonde

@Vandermonde That's an interesting point. I initially considered mentioning the use of subscripts to distinguish between "different Xs" but didn't bother - think I might edit it in now. The argument that "you'd never get an odd total score if the sum was 2X" is very clear and convincing to someone who can't see the need to distinguish: thanks for sharing it.
Silverfish

0

Another way of thinking about it is that with random variables 2XX+X.

2X would mean two times the value of the outcome of X, while X+X would mean two trials of X. In other words, it's the difference between rolling a die once and doubling the result, vs rolling a die twice.


+1 This is a perfectly clear and correct answer. Welcome to our site!
whuber

Thanks @whuber!
Benjamin
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.