Intuizione dietro la formula per la varianza di una somma di due variabili


10

Lo so da studi precedenti che

Var(A+B)=Var(A)+Var(B)+2Cov(A,B)

Tuttavia, non capisco perché. Vedo che l'effetto sarà quello di "aumentare" la varianza quando A e B covary altamente. Ha senso che quando crei un composito da due variabili altamente correlate tenderai ad aggiungere le osservazioni alte da A con le osservazioni alte da B e le osservazioni basse da A con le osservazioni basse da B. Ciò tenderà a creare valori estremamente alti e bassi nella variabile composita, aumentando la varianza del composito.

Ma perché funziona per moltiplicare la covarianza per esattamente 2?


1
Se e sono perfettamente correlati positivamente allora e se sono perfettamente negativamente correlati allora . La covarianza misura quanto lontano sia il loro rapportoABVar(A+B)=Var(A)+Var(B)+2Var(A)Var(B)Var(A+B)=Var(A)+Var(B)2Var(A)Var(B)
Henry,

Risposte:


21

Risposta semplice:

La varianza implica un quadrato:

Var(X)=E[(XE[X])2]

Quindi, la tua domanda si riduce al fattore 2 nell'identità quadrata:

(a+b)2=a2+b2+2ab

Che può essere inteso visivamente come una decomposizione dello spazio di un quadrato di lato nella zona dei quadrati più piccoli dei lati e , oltre ai due rettangoli di lati e :(a+b)abab

inserisci qui la descrizione dell'immagine

Risposta più coinvolta:

Se vuoi una risposta matematicamente più coinvolta, la covarianza è una forma bilineare, il che significa che è lineare sia nel suo primo che nel secondo argomento, questo porta a:

Var(A+B)=Cov(A+B,A+B)=Cov(A,A+B)+Cov(B,A+B)=Cov(A,A)+Cov(A,B)+Cov(B,A)+Cov(B,B)=Var(A)+2Cov(A,B)+Var(B)

Nell'ultima riga, ho usato il fatto che la covarianza è simmetrica:

Cov(A,B)=Cov(B,A)

Per riassumere:

Sono due perché devi tenere conto sia di che di .cov(A,B)cov(B,A)


5

L'insieme di variabili casuali è uno spazio vettoriale e molte delle proprietà dello spazio euclideo possono essere analogizzate ad esse. La deviazione standard si comporta in modo molto simile a una lunghezza e la varianza come lunghezza al quadrato. L'indipendenza corrisponde all'essere ortogonale, mentre la perfetta correlazione corrisponde alla moltiplicazione scalare. Pertanto, la varianza di variabili indipendenti segue il Teorema di Pitagora: .
var(A+B)=var(A)+var(B)

Se sono perfettamente correlati, allora
std(A+B)=std(A)+std(B)

Si noti che questo equivale a
var(A+B)=var(A)+var(B)+2var(A)var(B)

Se non sono indipendenti, seguono una legge analoga alla legge dei coseni:
var(A+B)=var(A)+var(B)+2cov(A,B)

Si noti che il caso generale è uno tra l'indipendenza completa e la correlazione perfetta. Se e sono indipendenti, allora è zero. Così il caso generale è che ha sempre un termine e una termine, e quindi ha qualche variazione sul termine ; più le variabili sono correlate, maggiore sarà questo terzo termine. E questo è esattamente ciò che è: si tratta di volte la di e .ABcov(A,B)var(A,B)var(A)var(B)2var(A)var(B)2cov(A,B)2var(A)var(B)r2AB

var(A+B)=var(A)+var(B)+MeasureOfCorrelationPerfectCorrelationTerm

dove eMeasureOfCorrelation=r2PerfectCorrelationTerm=2var(A)var(B)

In altri termini, se , allorar=correl(A,B)

σA+B=σA2+σB2+2(rσA)(rσB)

Pertanto, è analogo al nella Legge dei Coseni.r2cos


2

Vorrei aggiungere che ciò che hai citato non è la definizione di , ma piuttosto una conseguenza delle definizioni di e . Quindi la risposta al motivo per cui vale quell'equazione è il calcolo effettuato da unità . La tua domanda potrebbe davvero essere il motivo per cui ciò ha un senso; informale:Var(A+B)VarCov

Quanto "varierà" dipende da quattro fattori:A+B

  1. Quanto varierebbe da solo.A
  2. Quanto varierebbe da solo.B
  3. Quanto varierà quando sposta (o varia).AB
  4. Quanto varierà quando sposta.BA

Il che ci porta a perché è un operatore simmetrico.

Var(A+B)=Var(A)+Var(B)+Cov(A,B)+Cov(B,A)
=Var(A)+Var(B)+2Cov(A,B)
Cov
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.