Misure di somiglianza o distanza tra due matrici di covarianza


28

Esistono misure di somiglianza o distanza tra due matrici di covarianza simmetriche (entrambe aventi le stesse dimensioni)?

Qui sto pensando ad analoghi alla divergenza di KL di due distribuzioni di probabilità o alla distanza euclidea tra vettori tranne che applicata alle matrici. Immagino che ci sarebbero parecchie misurazioni di somiglianza.

Idealmente, vorrei anche verificare l'ipotesi nulla che due matrici di covarianza siano identiche.


3
le risposte a questa domanda: quant.stackexchange.com/q/121/108 potrebbe essere di qualche utilità.
shabbychef,

2
ottima domanda e risposta sul link - grazie - sì, questo è dove stavo andando :)
Ram Ahluwalia

Risposte:


21

ABpi,j(aijbij)2L2(AB)212[tr(A1B)ln(|B|/|A|)]

Modifica: se una delle matrici è una matrice implicita nel modello e l'altra è la matrice di covarianza del campione, ovviamente è possibile formare un test del rapporto di verosimiglianza tra i due. La mia raccolta personale preferita di tali test per strutture semplici è data in Metodi di analisi multivariata di Rencher (2002) . I casi più avanzati sono coperti dalla modellizzazione della struttura della covarianza, sulla quale un ragionevole punto di partenza è l' equazione strutturale di Bollen (1989) con le variabili latenti .


ho un problema con : non dà lo stesso valore se permetti e (una distanza reale dovrebbe essere simmetrica). 1/2(tr(A1B)log(|B|/|A|))AB
user603

ho un problema con : non è affine equivariante (se si ruotano le matrici, la distanza cambia!). Inoltre, dovresti in qualche modo ridimensionare le tue matrici (potrebbero essere misurate in unità molto diverse), inoltre, è naturale richiedere che la distanza tra due matrici di covarianza sia uguale alla distanza tra le matrici di correlazione corrispondenti: quindi suggerisco . (AB)2(Adet(A)1/pBdet(B)1/p)2
user603

2
Innanzitutto, KL non è una vera distanza, e questo è un fatto ben noto. In secondo luogo, se le matrici sono misurate in unità diverse, non possono essere uguali.
StasK,

La distanza KL è simile al rapporto di verosimiglianza o sono correlate?
Hashmuke,

7

Indica e tue matrici di entrambe le dimensioni .Σ1Σ2p

  1. Numero cond: dove ( ) è l'autovalore più grande (più piccolo) di , dove è definito come: log(λ1)log(λp)λ1λpΣΣΣ:=Σ11/2Σ2Σ11/2

Modifica: ho modificato la seconda delle due proposte. Penso di aver frainteso la domanda. La proposta basata sui numeri delle condizioni viene utilizzata molto spesso in statistiche affidabili per valutare la qualità dell'adattamento. Una vecchia fonte che ho trovato è:

Yohai, VJ e Maronna, RA (1990). La massima propensione per le robuste Covarianze. Communications in Statistics – Theory and Methods, 19, 3925–2933.

Inizialmente avevo incluso la misura del rapporto Det:

  1. Rapporto det: dove .log(det(Σ)/det(Σ2)det(Σ1))Σ=(Σ1+Σ2)/2

quale sarebbe la distanza di Bhattacharyya tra due distribuzioni gaussiane aventi lo stesso vettore di posizione. Devo aver originariamente letto la domanda come pertinente a un'ambientazione in cui le due covarianze provenivano da campioni di popolazioni che si presumeva avessero lo stesso mezzo.


7

Una misura introdotta da Herdin (2005) Correlation Matrix Distance, una misura significativa per la valutazione dei canali MIMO non stazionari è dove la norma è la norma di Frobenius.

d=1tr(R1R2)R1R2,


+1. Grazie mille per questa risposta, mi è stato molto utile.
ameba dice Ripristina Monica il

1
Questa è una meno somiglianza del coseno, giusto?
Firebug

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.