Ho una grande matrice (650K righe * 62 colonne) di dati binari (solo voci 0-1). La matrice è prevalentemente sparsa: circa l'8% è riempito.
Vorrei raggrupparlo in 5 gruppi - diciamo chiamato da 1 a 5. Ho provato il clustering gerarchico e non sono stato in grado di gestire le dimensioni. Ho anche usato l'algoritmo di clustering dei k-media basato sulla distanza di hamming, considerando i vettori di bit 650K di lunghezza 62. Non ho ottenuto risultati adeguati con nessuno di questi.
Per favore aiuto.