Il modo classico di analisi dei componenti principali (PCA) è quello di farlo su una matrice di dati di input le cui colonne hanno media zero (quindi il PCA può "massimizzare la varianza"). Ciò può essere ottenuto facilmente centrando le colonne. Tuttavia, quando la matrice di input è sparsa, la matrice centrata ora sarà più sparsa e, se la matrice è molto grande, non si adatta più alla memoria. Esiste una soluzione algoritmica per il problema di archiviazione?