La maggior parte degli algoritmi di clustering che ho visto iniziano con la creazione di distanze a testa tra tutti i punti, il che diventa problematico su set di dati più grandi. Ce n'è uno che non lo fa? O lo fa in una sorta di approccio parziale / approssimativo / sfalsato?
Quale algoritmo / implementazione del clustering occupa meno di O (n ^ 2) spazio?
C'è un elenco di algoritmi e i loro requisiti di tempo e spazio da qualche parte?