Voglio raggruppare ~ 22000 punti. Molti algoritmi di clustering funzionano meglio con ipotesi iniziali di qualità superiore. Quali strumenti esistono che possono darmi una buona idea della forma approssimativa dei dati?
Voglio essere in grado di scegliere la mia metrica di distanza, quindi un programma a cui posso fornire un elenco di distanze a coppie andrebbe bene. Vorrei poter fare qualcosa come evidenziare una regione o un cluster sul display e ottenere un elenco di quali punti di dati si trovano in quell'area.
Software libero preferito, ma ho già SAS e MATLAB.