sfondo
Una matrice di covarianza per un vettore di variabili casuali incarna una procedura per calcolare la varianza di qualsiasi combinazione lineare di tali variabili casuali. La regola è che per qualsiasi vettore di coefficienti , X = ( X 1 , X 2 , … , X n ) ′ λ = ( λ 1 , … , λ n )AX=(X1,X2,…,Xn)′λ=(λ1,…,λn)
Var(λX)=λAλ′.(1)
In altre parole, le regole della moltiplicazione matriciale descrivono le regole delle varianze.
Due proprietà di sono immediate ed evidenti:A
Poiché le varianze sono aspettative di valori al quadrato, non possono mai essere negative. Pertanto, per tutti i vettori ,Le matrici di covarianza devono essere definite non negative.0 ≤ Var ( λ X ) = λ A λ ′ .λ
0≤Var(λX)=λAλ′.
Le varianze sono solo numeri - o, se leggi letteralmente le formule della matrice, sono matrici. Pertanto, non cambiano quando li trasponi. La trasposizione dà Dal momento che ciò vale per tutti , deve eguagliare la sua trasposizione : le matrici di covarianza devono essere simmetriche.( 1 ) λ A λ ′ = Var ( λ X ) = Var ( λ X ) ′ = ( λ A λ ′ ) ′ = λ A ′ λ ′ . λ A A ′1×1(1)
λAλ′=Var(λX)=Var(λX)′=(λAλ′)′=λA′λ′.
λAA′
Il risultato più profondo è che qualsiasi matrice simmetrica definita non negativa è una matrice di covarianza. A Ciò significa che in realtà esiste una variabile casuale valutata con vettore con come sua covarianza. Possiamo dimostrare questo con la costruzione in modo esplicito . Un modo è notare che la funzione di densità (multivariata) con la proprietà ha per la sua covarianza. (È necessaria una certa delicatezza quando non è invertibile, ma è solo un dettaglio tecnico.) A Xf( x 1 ,…, x n )log(f)∝- 1XAXf(x1,…,xn)
log(f)∝−12(x1,…,xn)A−1(x1,…,xn)′
AA
soluzioni
Consenti a e essere matrici di covarianza. Ovviamente sono quadrati; e se la loro somma ha senso, devono avere le stesse dimensioni. Dobbiamo solo controllare le due proprietà.XY
La somma.
Lascio questo come esercizio.
Questo è difficile. Un metodo che uso per pensare a problemi di matrice impegnativi è quello di fare alcuni calcoli con matrici . Esistono alcune matrici di covarianza comuni e familiari di queste dimensioni, come con e . La preoccupazione è che potrebbe non essere definito: cioè, potrebbe produrre un valore negativo quando si calcola una varianza? Se lo farà, allora avremmo meglio avere alcuni coefficienti negativi nella matrice. Ciò suggerisce di considerare per . Per ottenere qualcosa di interessante, potremmo inizialmente gravitare sulle matrici2×2
(abba)
a2≥b2a≥0XYX=(a−1−1a)
a≥1Y con strutture di aspetto diverso. Mi vengono in mente matrici diagonali, come con . (Nota come possiamo scegliere liberamente alcuni dei coefficienti, come e , perché possiamo ridimensionare tutte le voci in qualsiasi matrice di covarianza senza modificarne le proprietà fondamentali. Ciò semplifica la ricerca di esempi interessanti.)Y=(b001)
b≥0−11
Lascio a voi per calcolare e verificare se è sempre una matrice di covarianza per tutti i valori consentiti di e .XYab