Perché la matrice di correlazione deve essere semi-definita positiva e cosa significa essere o meno semi-definita positiva?


34

Ho studiato il significato della proprietà semi-definita positiva delle matrici di correlazione o covarianza.

Sto cercando informazioni su

  • Definizione di semi-definitività positiva;
  • Le sue proprietà importanti, implicazioni pratiche;
  • La conseguenza di avere determinante negativo, impatto sull'analisi multivariata o risultati della simulazione ecc.

5
Vuoi capire cosa semi-determinatezza è , o vuoi sapere perché matrici di correlazione devono essere semi-definita, o vuoi sapere quali importanti risultati sono implicite da questa proprietà?
whuber

4
Se le matrici di correlazione non fossero definite semi-positive, si potrebbero ottenere varianze negative.

Ho modificato un po 'la tua domanda, per favore controlla. Inoltre, si noti che una matrice con un numero pari di autovalori negativi avrà comunque un determinante positivo.
ttnphns,

Una matrice di covarianza NON è sempre uguale alla matrice di correlazione! La covarianza considera variabili normalizzate mentre la matrice di correlazione no.
Manoj Kumar,

1
Domande correlate: ogni matrice di covarianza è definita positiva? considera il caso più ampio delle matrici di covarianza, di cui le matrici di correlazione sono un caso speciale; inoltre ogni matrice di correlazione è semi-definita positiva? e ogni matrice di correlazione è definita positiva?
Silverfish,

Risposte:


38

La varianza di una somma ponderata di variabili casuali deve essere non negativa per tutte le scelte di numeri reali a i . Poiché la varianza può essere espressa come var ( i a i X i ) = i j a i a j cov ( X i , X j ) = i j a iΣioun'ioXioun'io

var(Σioun'ioXio)=ΣioΣjun'ioun'jCOV(Xio,Xj)=ΣioΣjun'ioun'jΣio,j,
abbiamo che la matrice di covarianza deve essere semidefinita positiva (che a volte viene definita definita non negativa). Ricordiamo che una matrice C è chiamata semidefinita positiva se e solo se i j a i a j C i , j0Σ=[Σio,j]C
ΣioΣjun'ioun'jCio,j0un'io,un'jR.

Grazie, ho rimosso il mio voto negativo ma non ho votato perché non risponde delle implicazioni pratiche. Supponiamo che io abbia una matrice non definita positiva (dovuta per esempio alla modifica da parte di "esperti"). Cosa accadrebbe se lo usassi per calibrare e / o simulare i dati? In particolare, questo è un vero problema quando si cerca di studiare una somma grande e ci sono solo pochi valori di autovalori negativi? Quale sarebbe un algoritmo efficiente per trasformare una matrice di correlazione semi-definita non positiva in una matrice semi-definita positiva? Quale sarebbe l'impatto di questo algoritmo?
lcrmorin,

@Were_cat Grazie per l'inversione del downvote.
Dilip Sarwate,

Potresti spiegare la prima uguaglianza nella prima equazione?
Vivek Subramanian,

1
@VivekSubramanian varianza è un caso speciale della funzione di covarianza: e la funzione di covarianza è bilineare (che significa che è una funzione lineare rispetto alla ogni argomento: COV ( Σ i un i X i , Yvar(X)=cov(X,X)
cov(iaiXi,Y)=iaicov(Xi,Y)cov(X,ibjYj,)=jbjcov(X,Yj)
Dilip Sarwate

18

La risposta è abbastanza semplice

La matrice di correlazione è così definita:

X=[x1,x2,...,xn]m×nmn

Xb=[(x1-μ1e)S1,(X2-μ2e)S2,(X3-μ3e)S3,...]μ1μ2S1e è un vettore di tutti 1 .

La matrice di correlazione è quindi

C=XB'XB

UNzz'UNz<0 .

Cw'Cw<0

(w'Cw)=(w'XB'XBw)=(XBw)'(XBw)=z12+z22...z=XBww'Cw è una somma di quadrati e quindi non può essere inferiore a zero.

UV'V


2
Questa è di gran lunga la risposta più concisa e più chiara. Grazie !
Yohan Obadia,

12

(La possibile scioltezza nel ragionamento sarebbe la mia. Non sono un matematico: questa è una rappresentazione, non una prova, e proviene dalla mia sperimentazione numerica, non dai libri.)

  1. Un semidefinito positivo matrice di (psd), chiamata anche matrice di Gramian, è una matrice senza autovalori negativi. La matrice con autovalori negativi non è semidefinita positiva o non gramiana. Entrambi possono essere definiti (senza autovalori zero) o singolari (con almeno un autovalore zero). [La parola "Gramian" è usata in molti significati diversi in matematica, quindi forse dovrebbe essere evitata.]
  2. In statistica, di solito applichiamo questi termini a una matrice di tipo SSCP, chiamata anche matrice di prodotto scalare. Le matrici di correlazione o covarianza sono casi particolari di tale matrice .
  3. npppnnmatrice di covarianza tra i casi. Quando lo calcoli da dati reali, la matrice sarà sempre Gramian. È possibile ottenere una matrice non Gramian (non psd) se (1) è una matrice di somiglianza misurata direttamente (cioè non calcolata dai dati) o la misura di somiglianza non è di tipo SSCP; (2) i valori della matrice non sono stati inseriti correttamente; (3) la matrice è in realtà Gramiana ma è (o così vicina ad essere) singolare che a volte il metodo spettrale per calcolare gli autovalori produce minuscoli negativi al posto di zero reale o minuscoli positivi.
  4. d122=h12+h22-2S12ShXYdXy2=σX2+σy2-2covXy
  5. mm
  6. mmm
  7. Quali sono le possibili cause o versioni della configurazione non Gramiana (non Euclidea)? Le risposte seguono dopo aver contemplato [punto 4].
    • mmd
    • Causa 2. Vi è una discrepanza generale (a livello di matrice) tra hddhh
    • dhh1+h2d12|h1-h2|
  8. |covioj|>σioσj

Fig. 1.

Fig. 1

Fig2.

Fig2

Fig3.

fig3


2
Il punto 6 ha bisogno di dimostrazione: hai dimostrato che una matrice di distanze euclidee quadrate è pd, ma affermi senza prove che a ciascuna matrice pd corrisponde una configurazione euclidea di punti. Inoltre non hai collegato la tua definizione di pd ("nessun autovalore negativo") a nessuna delle tue caratterizzazioni successive. L'idea chiave arriva alla fine (punto 8): una matrice pd può essere utilizzata per definire una distanza. Logicamente, è qui che dovresti iniziare l'analisi.
whuber

@whuber: Grazie per la valutazione critica. Temo che, quando si tratta di provare matematicamente qualcosa, affondo. Ho riportato parte della mia esperienza pratica (l'ho detto); la risposta non era proprio una sequenza analitica. Non ti piacerebbe quindi aggiungere la tua risposta che può correggere / migliorare la mia? Potrebbe rivelarsi un aiuto prezioso. Oppure, sei libero di lavorare sul mio testo per migliorarlo se lo trovi non del tutto inutile.
ttnphns,

PS Il mio punto 8 implica che, poiché il doppio centraggio fissa una configurazione di punti al suo centroide, questa stessa operazione non introduce non-euclidità (produce solo singolarità perché il nuovo punto, centro, appartiene allo stesso spazio). Quindi possiamo verificare se la configurazione iniziale era euclidea. Non è corretto?
ttnphns,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.