Ho un ampio set di dati e una somiglianza del coseno tra loro. Vorrei raggrupparli usando la somiglianza del coseno che mette insieme oggetti simili senza dover specificare in anticipo il numero di cluster che mi aspetto.
Ho letto la documentazione sklearn di DBSCAN e Affinity Propagation, dove entrambi richiedono una matrice di distanza (non matrice di somiglianza del coseno).
Davvero, sto solo cercando un algoritmo che non richiede a) una metrica di distanza eb) un numero predefinito di cluster .
Qualcuno sa di un algoritmo che lo farebbe?