Ogni matrice di correlazione è definita positiva?


11

Sto parlando qui delle matrici delle correlazioni di Pearson.

Ho sentito spesso dire che tutte le matrici di correlazione devono essere semidefinite positive. La mia comprensione è che le matrici definite positive devono avere autovalori , mentre le matrici semidefinite positive devono avere autovalori . Questo mi fa pensare che la mia domanda possa essere riformulata come "È possibile che le matrici di correlazione abbiano un autovalore ?"0 = 0>00=0

È possibile che una matrice di correlazione (generata da dati empirici, senza dati mancanti) abbia un autovalore o un autovalore ? E se fosse invece una matrice di correlazione della popolazione?< 0=0<0

Ho letto nella risposta in alto a questa domanda sulle matrici di covarianza che

Prendere in considerazione tre variabili, , e . La loro matrice di covarianza, , non è definita positiva, poiché esiste un vettore ( ) per il quale non è positivo.Y Z = X + Y M z = ( 1 , 1 , - 1 ) z M zXYZ=X+YMz=(1,1,1)zMz

Tuttavia, se invece di una matrice di covarianza faccio quei calcoli su una matrice di correlazione, allora risulta positivo. Quindi penso che forse la situazione sia diversa per le matrici di correlazione e covarianza.zMz

La mia ragione per chiedere è che mi è stato chiesto su StackOverflow , in relazione a una domanda che ho posto lì.


Se, ad esempio, due attributi sono una cosa, hanno solo nomi diversi, la matrice è singolare. Se due attributi si aggiungono a una costante, è di nuovo singolare, eccetera .
ttnphns,

Se una matrice di covarianza è singolare, anche la matrice di correlazione è singolare.
ttnphns,

2
Quasi duplicati: ogni matrice di correlazione è semi-definita positiva? che si concentra meno sull'angolo definito rispetto a quello semi-definito e ogni matrice di covarianza è definita positiva? che è rilevante perché una covarianza è essenzialmente una correlazione riscalata.
Silverfish,

Risposte:


16

Le matrici di correlazione non devono necessariamente essere definite positive.

Considera una variabile casuale scalare X con varianza diversa da zero. Quindi la matrice di correlazione di X con se stessa è la matrice di tutti, che è semi-definita positiva, ma non definita positiva.

Per quanto riguarda la correlazione del campione, considerare i dati del campione per quanto sopra, avendo la prima osservazione 1 e 1 e la seconda osservazione 2 e 2. Ciò comporta che la correlazione del campione è la matrice di tutti, quindi non definita positiva.

Una matrice di correlazione del campione, se calcolata in aritmetica esatta (ovvero, senza errori di arrotondamento) non può avere autovalori negativi.


4
Vale la pena menzionare i possibili effetti di valori mancanti sulla matrice di correlazione del campione . Il fuzz numerico non è l'unico motivo per ottenere un autovalore negativo in una matrice di correlazione / covarianza del campione.
Silverfish,

1
Sì, non l'ho reso esplicito, ma stavo assumendo, secondo la dichiarazione della domanda, "senza dati mancanti". Una volta entrati nel mondo selvaggio e stravagante dei dati mancanti e delle relative modifiche, tutto va bene.
Mark L. Stone,

Sì, mi dispiace, hai ragione, la domanda diceva "nessun dato mancante" - ho pensato che valesse la pena menzionarlo da qualche parte poiché i futuri ricercatori potrebbero essere interessati anche se l'appetito del PO è saziato!
Silverfish,

7

X1=X2X1=2X2

n<pn1pn+1n1


Vero 'dat. Suppongo che avrei potuto e dovuto fornire anche queste informazioni, ma il mio obiettivo era quello di produrre un controesempio per confutare l'ipotesi del PO, mostrando così la sua invalidità. Tuttavia, dovresti modificare la tua seconda frase in modo da essere "In questo caso matrici di covarianza e correlazione sarà al massimo rango n − 1, quindi ci saranno almeno (p − n + 1) zero autovalori. "
Mark L. Stone,

4

XY=2X(X,Y)2X=YE[Y2]=4E[X2]=σY2E[XY]=2E[X2]Cov(X,Y)=E[XY]EXEY=E[XY]

Λ=(1224),
Λ=(1111),
XY

2Λcov(X,Y)=E(XY)E(X)E(Y)=2E[X2]=2(σX2+[E(X)]2)E(X2)=Var(X)+[E(X)]2

diagΛ1/2ΛdiagΛ1/2

@AntoniParellada, non sono esattamente sicuro di cosa intendi: la covarianza qui è un calcolo diretto. Ma lo modificherò e lo renderò più chiaro. Grazie.
Yoki,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.