Per eseguire l'analisi dei componenti principali (PCA), è necessario sottrarre i dati di ciascuna colonna dai dati, calcolare la matrice del coefficiente di correlazione e quindi trovare gli autovettori e gli autovalori. Bene, piuttosto, questo è quello che ho fatto per implementarlo in Python, tranne per il fatto che funziona solo con piccole matrici perché il metodo per trovare la matrice del coefficiente di correlazione (corrcoef) non mi consente di usare un array con elevata dimensionalità. Dal momento che devo usarlo per le immagini, la mia attuale implementazione non mi aiuta davvero.
Ho letto che è possibile prendere semplicemente la tua matrice di dati e calcolare invece di , ma per me non funziona. Bene, non sono esattamente sicuro di capire cosa significhi, oltre al fatto che dovrebbe essere una matrice anziché (nel mio caso ). Ho letto su quelli nei tutorial sulle autovetture, ma nessuno di loro sembrava spiegarlo in modo tale da riuscire davvero a capirlo.D D ⊤ / n D ⊤ D / n n × n p × p p ≫ n
In breve, esiste una semplice descrizione algoritmica di questo metodo in modo che io possa seguirlo?