Molti libri di testo statistici forniscono un'illustrazione intuitiva di ciò che sono gli autovettori di una matrice di covarianza:
I vettori u e Z formano gli autovettori (bene, eigenaxes). Questo ha senso. Ma l'unica cosa che mi confonde è che estraiamo gli autovettori dalla matrice di correlazione , non dai dati grezzi. Inoltre, i set di dati non elaborati molto diversi possono avere matrici di correlazione identiche. Ad esempio, entrambi hanno matrici di correlazione di:
Come tali hanno autovettori che puntano nella stessa direzione:
Ma se dovessi applicare la stessa interpretazione visiva di quali direzioni erano gli autovettori nei dati grezzi, otterrai vettori che puntano in direzioni diverse.
Qualcuno può dirmi dove ho sbagliato?
Seconda modifica : se potessi essere così audace, con le eccellenti risposte di seguito sono stato in grado di dare un senso alla confusione e di averlo illustrato.
La spiegazione visiva è coerente con il fatto che gli autovettori estratti dalla matrice di covarianza sono distinti.
Covarianze ed autovettori (rosso):
Covarianze ed autovettori (blu):
Le matrici di correlazione riflettono le matrici di covarianza delle variabili standardizzate. L'ispezione visiva delle variabili standardizzate dimostra perché nel mio esempio vengono estratti autovettori identici:
[PCA]
tag. Se vuoi ri-focalizzare la domanda, o porre una nuova domanda (correlata) e collegarti a questa, questo sembra a posto, ma penso che questa domanda sia abbastanza PCA per meritare il tag.