Perché il grado di matrice di covarianza è al massimo


17

Come indicato in questa domanda, il rango massimo della matrice di covarianza è n1 dove n è la dimensione del campione e quindi se la dimensione della matrice di covarianza è uguale alla dimensione del campione, sarebbe singolare. Non riesco a capire perché sottraiamo 1 dal rango massimo n della matrice di covarianza.


1
Per ottenere l'intuizione, pensa a n=2 punti in 3D. Qual è la dimensionalità del sottospazio in cui si trovano questi punti? Puoi inserirli su una linea (sottospazio 1D)? O hai bisogno di un piano (sottospazio 2D)?
ameba dice di reintegrare Monica il

Quindi capisci che n=2 porta alla matrice di covarianza di grado 1? Ok, prendiamo n=3 punti. Riesci a vedere che puoi sempre adattarli su un piano 2D?
ameba dice di reintegrare Monica il

4
@amoeba il tuo esempio è stato chiaro, ma non riesco a capire quale sia la relazione tra l'iperpiano adatto nel tuo esempio e la matrice di covarianza?
user3070752,

Ci

Risposte:


20

Lo stimatore imparziale della matrice di covarianza del campione dato punti di dati x iR d è C = 1nxiRddove ˉ x =xi/nè la media su tutti i punti. Indichiamo(xi- ˉ x )comezi. Il1

C=1n1i=1n(xix¯)(xix¯),
x¯=xi/n(xix¯)zi fattore non cambia il rango, e ogni termine nella somma ha (per definizione) rango1, quindi il nocciolo della domanda è il seguente:1n11

Perché ho rango n - 1 e non rango n , come sembrerebbe, perché stiamo sommando n di ranghi 1 matrici?zizin1nn1

La risposta è che succede perché non sono indipendenti. Per costruzione, z i = 0 . Quindi se conosci n - 1 di z i , allora l'ultimo z n rimanente è completamente determinato; non stiamo sommando n matrici di grado 1 indipendenti , stiamo sommando solo n - 1 matrici di grado 1 indipendenti e quindi aggiungendo un'altra matrice di grado 1 che è completamente linearmente determinata dal resto. Quest'ultima aggiunta non cambia il grado generale.zizi=0n1ziznn1n111

Possiamo vederlo direttamente se riscriviamo come z n = - n - 1 i = 1 z i , e ora lo inseriamo nell'espressione sopra: n i = 1 z i z i = n - 1 i = 1 z i z i + ( - n - 1 i = 1zi=0

zn=i=1n1zi,
Ora rimangono solo n - 1 termini nella somma e diventa chiaro che l'intera somma può avere al massimo il grado n - 1 .
i=1nzizi=i=1n1zizi+(i=1n1zi)zn=i=1n1zi(zizn).
n1n1

Questo risultato, tra l'altro, suggerisce perché il fattore nello stimatore imparziale della covarianza sia e non11n1 .1n

L'intuizione geometrica a cui ho accennato nei commenti sopra è che si può sempre adattare una linea 1D a due punti qualsiasi in 2D e si può sempre adattare un piano 2D a tre punti qualsiasi in 3D, ovvero la dimensionalità del sottospazio è sempre ; questo funziona solo perché supponiamo che questa linea (e piano) possa essere "spostata" per adattarci ai nostri punti. "Posizionare" questa linea (o piano) in modo che passi attraverso ˉ x equivale a centrare nell'argomento algebrico sopra.n1x¯


0

Un po 'più breve, credo, la spiegazione va così:

nmxnm

xmin(n,m)

nmz

z=xE[x]

min(n,m1)

i=1mzi=0

z

x

cov(x,x)=1m1zzT

rank(zzT)

rank(zzT)=rank(z)=min(n,m1)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.