Ho studiato k-mean e questi sono ciò che ho ottenuto: k-mean è uno degli algoritmi più semplici che utilizza un metodo di apprendimento senza supervisione per risolvere i problemi noti del clustering. Funziona davvero bene con set di dati di grandi dimensioni.
Tuttavia, ci sono anche degli svantaggi di K-Means che sono:
- Forte sensibilità a valori anomali e rumore
- Non funziona bene con la forma del cluster non circolare - il numero di cluster e il valore iniziale del seme devono essere specificati in anticipo
- Bassa capacità di superare l'ottimale locale.
C'è qualcosa di eccezionale in k-mean, perché sembra che gli svantaggi siano oltre le cose buone di k-mean.
Per favore, insegnami.