Troviamo i centri del cluster e assegniamo punti a k diversi bin del cluster nel clustering k-mean che è un algoritmo molto noto e si trova quasi in ogni pacchetto di machine learning in rete. Ma la parte mancante e più importante secondo me è la scelta di un k corretto. Qual è il miglior valore per questo? E cosa si intende per migliore ?
Uso MATLAB per il calcolo scientifico in cui viene dato uno sguardo alle trame di silhouette come un modo per decidere su k discusso qui . Tuttavia, sarei più interessato agli approcci bayesiani. Eventuali suggerimenti sono apprezzati.