Considera cosa fa PCA. In parole povere, PCA (come più comunemente eseguito) crea un nuovo sistema di coordinate:
- spostando l'origine sul centroide dei tuoi dati,
- stringe e / o allunga gli assi per renderli uguali in lunghezza, e
- ruota i tuoi assi in un nuovo orientamento.
(Per maggiori dettagli, vedere questo eccellente thread CV: dare un senso all'analisi dei componenti principali, autovettori e autovalori .) Tuttavia, non ruota solo gli assi in un modo vecchio. La tua nuova (il primo componente principale) è orientata nella direzione della variazione massima dei tuoi dati. Il secondo componente principale è orientato nella direzione della successiva maggiore quantità di variazione che è ortogonale al primo componente principale . I componenti principali rimanenti sono formati allo stesso modo. X1
Con questo in mente, esaminiamo l'esempio di @ amoeba . Ecco una matrice di dati con due punti in uno spazio tridimensionale:
Vediamo questi punti in un diagramma a dispersione tridimensionale (pseudo):
X=[121212]
(1.5,1.5,1.5)(0,0,0)(3,3,3)(0,0,3)(3,3,0)(0,3,0)(3,0,3)
N=2N−1=1