Varianza del prodotto di k variabili casuali correlate


Risposte:


12

Ulteriori informazioni su questo argomento di quelle che probabilmente richiedono sono reperibili in Goodman (1962): "La varianza del prodotto delle variabili casuali K" , che deriva formule per variabili casuali indipendenti e variabili casuali potenzialmente correlate, insieme ad alcune approssimazioni. In un precedente documento ( Goodman, 1960 ), è stata derivata la formula per il prodotto di esattamente due variabili casuali, che è un po ' più semplice (anche se ancora piuttosto nodoso), quindi potrebbe essere un punto di partenza migliore se si desidera comprendere la derivazione .

Per completezza, però, va così.

Due variabili

Supponiamo che:

  • yx ed sono due variabili casualiy
  • YX e sono le loro aspettative (diverse da zero)Y
  • V ( y )V(x) e sono le loro varianzeV(y)
  • δ yδx=(xX)/X (e similmente per )δy
  • Di,j=E[(δx)i(δy)j]
  • Δ yΔx=xX (e similmente per )Δy
  • Ei,j=E[(Δx)i(Δy)j]
  • V ( x ) / X 2 G ( Y )G(x) è il coefficiente di variazione al quadrato: (anche per )V(x)/X2G(Y)

Quindi: o equivalentemente:

V(xy)=(XY)2[G(y)+G(x)+2D1,1+2D1,2+2D2,1+D2,2D1,12]

V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12

Più di due variabili

L'articolo del 1960 suggerisce che questo è un esercizio per il lettore (che sembra aver motivato l'articolo del 1962!).

La notazione è simile, con alcune estensioni:

  • x y(x1,x2,xn) essere variabili casuali invece di edxy
  • M=E(i=1kxi)
  • A=(M/i=1kXi)1
  • i = 1 , 2 , ksi = 0, 1 o 2 peri=1,2,k
  • ( s 1 , s 2 , s k )u = numero di 1 in(s1,s2,sk)
  • ( s 1 , s 2 , s k )m = numero di 2 in(s1,s2,sk)
  • m = 0 2 u m > 1D(u,m)=2u2 per e per ,m=02um>1
  • C(s1,s2,,sk)=D(u,m)E(i=1kδxisi)
  • s1sk indica la somma dei set di dove3kk1(s1,s2,sk)2m+u>1

Quindi, finalmente:

V(i=1kxi)=Xi2(s1skC(s1,s2sk)A2)

Vedi i documenti per dettagli e approssimazioni leggermente più tracciabili!


si prega di notare che la risposta di cui sopra di Matt Krause contiene un errore e il documento stesso. Nella definizione della funzione C (s1, ..., sk) dovrebbe essere un prodotto anziché una somma.
Nicolas Gisler,

Potresti approfondire un po 'di più ..? "Perché io - una persona anonima di Internet - lo dico" non è proprio una risposta ...
Tim

Se provi a ottenere la varianza var (x * y) per variabili casuali indipendenti, tramite la formula per k arbitraria puoi vedere che solo un prodotto e non una somma ti dà la risposta corretta. Inoltre, se guardi il foglio puoi anche vederlo, a pagina 59 del documento (almeno nella mia versione) ha usato un prodotto anziché una somma.
Nicolas Gisler,

1
Per il caso di due variabili casuali, una formula più facile da leggere per la varianza del prodotto di due variabili casuali correlate può essere trovata in questa risposta da @macro. Questa risposta indica anche il problema essenziale in vale a dire, il boschetto di notazione nasconde il fatto essenziale che ci sono termini in esso il cui valore non può essere determinato se non si conosce cov , o abbastanza circa la densità articolare delle due variabili casuali per determinare questa quantità.
V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12,
(x2,y2)
Dilip Sarwate,

Un suggerimento di modifica, che avrebbe dovuto essere davvero un commento, suggeriva che il documento originale conteneva un refuso in cui una somma e un prodotto venivano mescolati e questa risposta doveva essere modificata. Vedi stats.stackexchange.com/review/suggested-edits/83662
Silverfish

4

Solo per aggiungere alla fantastica risposta di Matt Krause (in effetti facilmente derivabile da lì). Se x, y sono indipendenti, allora,

E1,1=E[(xE[x])(yE[y])]=Cov(x,y)=0E1,2=E[(xE[x])(yE[y])2]=E[xE(x)]E[(yE[y])2]=(E[x]E[x])E[(yE[y])2]=0E2,1=0E2,2=E[(xE[x])2(yE[y])2]=E[(xE[x])2]E[(yE[y])2=V[x]V[y]V[xy]=E[x]2V[y]+E[y]2V[x]+V[x]V[y]

1
Il risultato per il caso di variabili casuali indipendenti è stato discusso qui . n
Dilip Sarwate,

3

Oltre alla formula generale data da Matt, può essere utile notare che esiste una formula un po 'più esplicita per le variabili casuali gaussiane a media zero. Deriva dal teorema di Isserlis , vedi anche Momenti più elevati per la distribuzione normale multivariata centrata.

Supponiamo che segua una distribuzione normale multivariata con media 0 e matrice di covarianza . Se il numero di variabili è dispari, e dove significa somma su tutte le partizioni di in coppie disgiunte con ogni termine che è un prodotto delle corrispondenti e dove (x1,,xk)ΣkE(ixi)=0

V(ixi)=E(ixi2)=Σ~i,j
Σ{1,,2k}k{i,j}k Σ~i,j
Σ~=(ΣΣΣΣ)
è la matrice di covarianza per . Se è pari, Nel caso otteniamo Se otteniamo dove ci sono 15 termini nella somma.(x1,,xk,x1,,xk)k
V(ixi)=Σ~i,j(Σi,j)2.
k=2
V(x1x2)=Σ1,1Σ2,2+2(Σ1,2)2Σ1,22=Σ1,1Σ2,2+(Σ1,2)2.
k=3
V(x1x2x3)=Σi,jΣk,lΣr,t,

È infatti possibile implementare la formula generale. La parte più difficile sembra essere il calcolo delle partizioni richieste. In R, questo può essere fatto con la funzione setpartsdal pacchetto partitions. Utilizzando questo pacchetto non è stato un problema generare le 2.027.025 partizioni per , anche le partizioni 34.459.425 per potevano essere generate, ma non le 654.729.075 partizioni per (sul mio laptop da 16 GB).k = 9 k = 10k=8k=9k=10

Vale la pena notare un paio di altre cose. Innanzitutto, per le variabili gaussiane con media diversa da zero dovrebbe essere possibile derivare anche un'espressione dal teorema di Isserlis. In secondo luogo, non è chiaro (per me) se la formula sopra è robusta contro le deviazioni dalla normalità, cioè se può essere usata come approssimazione anche se le variabili non sono multivariate normalmente distribuite. In terzo luogo, sebbene le formule di cui sopra siano corrette, è lecito chiedersi quanto la varianza indichi sulla distribuzione dei prodotti. Anche per la distribuzione del prodotto è abbastanza leptico, e per più grandi diventa rapidamente estremamente leptico.kk=2k


Approccio pulito! Per quello che vale, la formula nella mia risposta ha anche un ingrandimento combinatorio: la sommatoria sopra C implica la somma di termini . O(3k)
Matt Krause,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.