Esiste uno scopo specifico in termini di efficienza o funzionalità perché l'algoritmo k-mean non utilizza ad esempio la cosine (dis) somiglianza come metrica della distanza, ma può usare solo la norma euclidea? In generale, il metodo K-mean sarà conforme e sarà corretto quando verranno prese in considerazione o utilizzate distanze diverse da Euclide?
[Aggiunta di @ttnphns. La domanda è duplice. La "distanza (non) euclidea" può riguardare la distanza tra due punti dati o la distanza tra un punto dati e un centro del cluster. Finora entrambi i modi sono stati tentati di affrontare le risposte.]