In quali condizioni K-significa clustering invariante alla trasformazione?


8

Dato un insieme di punti dati X={x1,x2,,xm} dove xiRd eseguiamo K-mean X e ottenere i cluster c1,c2,,ck.

Ora, se creiamo un nuovo set di dati Y={y1,y2,,ym} dove yi=Axi+b e yiRd ed esegui K-significa su Y per ottenere cluster g1,g2,gk.

In quali condizioni di A e b abbiamo la garanzia di ottenere gli stessi cluster?

Supponiamo che K-medie stia usando la distanza euclidea e abbia le stesse condizioni iniziali su entrambi gli algoritmi, cioè se i centri iniziali per X sono c10,,ck0 quindi i centri iniziali per Y sono g10,,gk0 dove gi0=Aci0+b.

Finora l'ho pensato A deve essere al massimo e bpuò essere qualsiasi vettore. Tuttavia, non sono stato in grado di dimostrarlo.

Risposte:


6

La risposta dipende dall'algoritmo K-mean, ma ciò che segue dovrebbe funzionare per gli algoritmi standard.

Otterrai lo stesso risultato se la tua trasformazione T soddisfa due condizioni:

  1. Mantiene le distanze: d(z,w)=d(T(z),T(w)), dove d è la tua metrica, diciamo d(z,w)=zw.
  2. Conserva le medie: se è una combinazione convessa che .ipiziT(ipizi)=ipiT(zi)

Puoi verificarlo andando sull'algoritmo, dimostrando che fa sempre le stesse scelte.


Grazie Yuval, questo ha molto senso. Ciò significherebbe quindi che per la distanza euclidea, A dovrebbe essere una matrice ortogonale per creare una trasformazione rigida?
Ana Echavarria,

Sembra proprio così.
Yuval Filmus,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.