Dato un insieme di punti dati dove eseguiamo K-mean e ottenere i cluster .
Ora, se creiamo un nuovo set di dati dove e ed esegui K-significa su per ottenere cluster .
In quali condizioni di e abbiamo la garanzia di ottenere gli stessi cluster?
Supponiamo che K-medie stia usando la distanza euclidea e abbia le stesse condizioni iniziali su entrambi gli algoritmi, cioè se i centri iniziali per X sono quindi i centri iniziali per Y sono dove .
Finora l'ho pensato deve essere al massimo e può essere qualsiasi vettore. Tuttavia, non sono stato in grado di dimostrarlo.