Qual è la varianza del prodotto di variabili casuali correlate?
Qual è la varianza del prodotto di variabili casuali correlate?
Risposte:
Ulteriori informazioni su questo argomento di quelle che probabilmente richiedono sono reperibili in Goodman (1962): "La varianza del prodotto delle variabili casuali K" , che deriva formule per variabili casuali indipendenti e variabili casuali potenzialmente correlate, insieme ad alcune approssimazioni. In un precedente documento ( Goodman, 1960 ), è stata derivata la formula per il prodotto di esattamente due variabili casuali, che è un po ' più semplice (anche se ancora piuttosto nodoso), quindi potrebbe essere un punto di partenza migliore se si desidera comprendere la derivazione .
Per completezza, però, va così.
Supponiamo che:
Quindi: o equivalentemente:
L'articolo del 1960 suggerisce che questo è un esercizio per il lettore (che sembra aver motivato l'articolo del 1962!).
La notazione è simile, con alcune estensioni:
Quindi, finalmente:
Vedi i documenti per dettagli e approssimazioni leggermente più tracciabili!
Solo per aggiungere alla fantastica risposta di Matt Krause (in effetti facilmente derivabile da lì). Se x, y sono indipendenti, allora,
Oltre alla formula generale data da Matt, può essere utile notare che esiste una formula un po 'più esplicita per le variabili casuali gaussiane a media zero. Deriva dal teorema di Isserlis , vedi anche Momenti più elevati per la distribuzione normale multivariata centrata.
Supponiamo che segua una distribuzione normale multivariata con media 0 e matrice di covarianza . Se il numero di variabili è dispari,
e
dove significa somma su tutte le partizioni di in coppie disgiunte con ogni termine che è un prodotto delle corrispondenti e dove
È infatti possibile implementare la formula generale. La parte più difficile sembra essere il calcolo delle partizioni richieste. In R, questo può essere fatto con la funzione setpartsdal pacchetto partitions. Utilizzando questo pacchetto non è stato un problema generare le 2.027.025 partizioni per , anche le partizioni 34.459.425 per potevano essere generate, ma non le 654.729.075 partizioni per (sul mio laptop da 16 GB).k = 9 k = 10
Vale la pena notare un paio di altre cose. Innanzitutto, per le variabili gaussiane con media diversa da zero dovrebbe essere possibile derivare anche un'espressione dal teorema di Isserlis. In secondo luogo, non è chiaro (per me) se la formula sopra è robusta contro le deviazioni dalla normalità, cioè se può essere usata come approssimazione anche se le variabili non sono multivariate normalmente distribuite. In terzo luogo, sebbene le formule di cui sopra siano corrette, è lecito chiedersi quanto la varianza indichi sulla distribuzione dei prodotti. Anche per la distribuzione del prodotto è abbastanza leptico, e per più grandi diventa rapidamente estremamente leptico.k