Come trovare la varianza tra punti multidimensionali?


12

Supponiamo che io abbia una matrice X che è n per p, cioè che ha n osservazioni, con ogni osservazione nello spazio p-dimensionale.

Come posso trovare la varianza di queste n osservazioni?

Nel caso in cui p = 1, ho solo bisogno di usare la formula di varianza regolare. Che dire dei casi in cui p> 1.

Risposte:


18

Per un variabile casuale dimensionale , abbiamo la seguente definizione della varianza:X = ( X 1 , , X p )pX=(X1,,Xp)

Var(X)=E[(XEX)(XEX)]=(Var(X1)Cov(X1,Xp)Cov(Xp,X1)Var(Xp))

Cioè, la varianza di un vettore casuale è definita come la matrice che memorizza tutte le varianze sulla diagonale principale e le covarianze tra i diversi componenti negli altri elementi. La matrice di covarianza campione verrebbe quindi calcolata collegando gli analoghi del campione per le variabili di popolazione:p×p

XijijˉXjj

1n1(i=1n(Xi1X¯1)2i=1n(Xi1X¯1)(XipX¯p)i=1n(XipX¯p)(Xi1X¯1)i=1n(XipX¯p)2)
dove indica la esima osservazione per funzione e la media campionaria delXijijX¯jjth caratteristica. Per riassumere, la varianza di un vettore casuale è definita come la matrice contenente le singole varianze e covarianze. È quindi sufficiente calcolare le varianze e le covarianze del campione per tutti i componenti vettoriali singolarmente.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.