Come si applica il "Teorema fondamentale dell'analisi fattoriale" alla PCA o come vengono definiti i caricamenti della PCA?


14

Attualmente sto esaminando un set di diapositive che ho per "analisi fattoriale" (per quanto ne so PCA).

In esso viene derivato il "teorema fondamentale dell'analisi fattoriale" che afferma che la matrice di correlazione dei dati che vanno in analisi ( ) può essere recuperata usando la matrice di load factor (R ):A

R=AA

Questo però mi confonde. Nella PCA la matrice di "load factor" è data dalla matrice di autovettori della matrice di covarianza / correlazione dei dati (dato che assumiamo che i dati siano stati standardizzati, sono gli stessi), con ogni autovettore ridimensionato per avere lunghezza uno. Questa matrice è ortogonale, quindi , che in genere non è uguale a R .AA=ioR


Oltre alla risposta di @ amoeba, guarda nella mia risposta aggiungendo l'ambiguità terminologica. Non consiglio di chiamare la matrice degli autovettori A(che sono caricamenti), per motivi di chiarezza. La matrice (lato destro) dell'autovettore è generalmente etichettata V(perché R=USV'da svd), non A. Un altro nome equivalente (derivante dalla terminologia del biplot) per autovettori è "coordinate standard" e per i caricamenti è "coordinate principali".
ttnphns,

("coordinate standard" - perché l'inerzia, o scala degli autovalori, è magnitudo unitaria quando li investi; "coordinate principali" - perché è magnitudine originale originale quando li
investi

Risposte:


17

Questa è una domanda ragionevole (+1) che deriva dall'ambiguità terminologica e dalla confusione.

Nel contesto della PCA, le persone spesso chiamano "caricamenti" gli assi principali (autovettori della matrice di covarianza / correlazione). Questa è una terminologia sciatta. Ciò che dovrebbe piuttosto essere chiamato "caricamento" in PCA, sono gli assi principali ridimensionati dalle radici quadrate dei rispettivi autovalori. Quindi il teorema a cui ti riferisci rimarrà valido.

R=VSV
dove V sono autovettori (assi principali) e S è una matrice diagonale di autovalori e se definiamo carichi come
UN=VS1/2,
allora si può facilmente vedere quello
R=UNUN.
Inoltre, il miglior rango-r l'approssimazione alla matrice di correlazione è data dal primo r Caricamenti di PCA:
RUNrUNr.

Per ulteriori informazioni sulla ricostruzione di matrici di covarianza con analisi dei fattori e caricamenti di PCA, vedere la mia risposta qui .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.