Ho un set di dati con ~ 1M righe e ~ 500K caratteristiche sparse. Voglio ridurre la dimensionalità da qualche parte nell'ordine delle caratteristiche dense 1K-5K.
sklearn.decomposition.PCA
non funziona su dati sparsi e ho provato a usare sklearn.decomposition.TruncatedSVD
ma ho un errore di memoria abbastanza rapidamente. Quali sono le mie opzioni per un'efficace riduzione della dimensionalità su questa scala?