Ho una domanda basilare sul clustering. Dopo aver trovato k cluster con i loro centroidi, come posso fare per interpretare le classi dei punti dati che ho raggruppato (assegnando etichette di classe significative a ciascun cluster). Non sto parlando della convalida dei cluster trovati.
Può essere fatto in base a un piccolo insieme etichettato di punti dati, calcolare a quale cluster appartengono questi punti etichettati e in base al tipo e al numero di punti che ciascun cluster riceve, decidere l'etichetta? Sembra abbastanza ovvio, ma non so quanto sia standard assegnare le etichette ai cluster in questo modo.
Per essere chiari, voglio eseguire un clustering senza supervisione che non utilizza etichette per trovare prima i miei cluster. Dopo aver trovato i cluster, desidero assegnare etichette di classe significative ai cluster in base alle proprietà di alcuni punti dati di esempio.