L'algoritmo PCA può essere formulato in termini di matrice di correlazione (supponiamo che i dati già stati normalizzati e stiamo considerando solo la proiezione sul primo PC). La funzione obiettivo può essere scritta come:
Questo va bene, e usiamo moltiplicatori lagrangiani per risolverlo, cioè riscrivendolo come:
che equivale a
e quindi ( vedi qui su Mathworld ) sembra essere uguale a
Ma questo sta dicendo per massimizzare la distanza tra punto e linea, e da quello che ho letto qui , questo non è corretto - dovrebbe essere , non \ max . Dov'è il mio errore?
Oppure qualcuno può mostrarmi il legame tra massimizzare la varianza nello spazio proiettato e minimizzare la distanza tra punto e linea?