Perché i punteggi dei componenti principali non sono correlati?


9

Supose è una matrice di dati centrati sulla media. La matrice è , ha autovalori distinti e autovettori , ... , che sono ortogonali.AS=COV(UN)m×mmS1S2Sm

L' -esimo componente principale (alcune persone li chiamano "punteggi") è il vettore . In altre parole, è una combinazione lineare delle colonne di , in cui i coefficienti sono i componenti del -esimo autovettore .iozio=UNSioUNioS

Non capisco perché e non correlati per tutti . Se dal fatto che e sono ortogonali? Sicuramente no, perché posso facilmente trovare una matrice e una coppia di vettori ortogonali tali che e siano correlati.ziozjiojSioSjBX,yBXBy


Risposte:


7

ziozj=(UNSio)(UNSj)=SioUNUNSj=(n-1)SioSSj=(n-1)SioλjSj=(n-1)λjSioSj=0.

1
Matematica: che lingua meravigliosa.
Néstor,

4
Ciò significa che e sono ortogonali. Non correlato significa che questo deve essere vero: . Suppongo che in qualche modo e quindi implica anche che non sono correlati. z j ( z i - ˉ z i ) ( z j - ˉ z j )=0 ˉ z i = ˉ z j =0 z i z j =0ziozj(zio-z¯io)(zj-z¯j)=0z¯io=z¯j=0ziozj=0
Ernest A

2
Buon punto, @Ernest. I mezzi sono effettivamente zero, perché i dati sono stati centrati sulla media (come si suppone). Quindi tutte le proiezioni devono avere zero medio.
ameba,

2
@Jubbles perché , quindi . AA=(n-1)SS=COV(UN)=1n-1UNUNUNUN=(n-1)S
Ernest A

2
@Ernest, non ho potuto resistere nel fornire una risposta che non contiene testo, ma forse dovrei aggiungere che il motivo alla base della non correlazione dei PC è che la loro matrice di covarianza è data da nella base degli autovettori, e in questa base diventa diagonale - - questo è il punto centrale della composizione elettronica. SSS
ameba,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.