I dati del mondo reale a volte hanno un numero naturale di cluster (il tentativo di raggrupparli in un numero di cluster inferiore a qualche k magico causerà un drammatico aumento del costo del clustering). Oggi ho partecipato a una conferenza del Dr. Adam Meyerson e ha indicato quel tipo di dati come "dati separabili".
Quali sono alcune formalizzazioni di clustering, diverse dai mezzi K, che potrebbero essere suscettibili di algoritmi di clustering (approssimazioni o euristiche) che sfrutteranno la naturale separabilità dei dati?