In quali condizioni K-significa clustering invariante alla trasformazione?

Dato un insieme di punti dati $X = \{x_1, x_2, \ldots, x_m\}$ dove $x_i \in \mathbb{R}^d$ eseguiamo K-mean $X$ e ottenere i cluster $c_1, c_2, \ldots, c_k$ .

Ora, se creiamo un nuovo set di dati $Y = \{y_1, y_2, \ldots, y_m\}$ dove $y_i = Ax_i + b$ e $y_i \in \mathbb{R}^d$ ed esegui K-significa su $Y$ per ottenere cluster $g_1, g_2, \ldots g_k$ .

In quali condizioni di $A$ e $b$ abbiamo la garanzia di ottenere gli stessi cluster?

Supponiamo che K-medie stia usando la distanza euclidea e abbia le stesse condizioni iniziali su entrambi gli algoritmi, cioè se i centri iniziali per X sono $c^0_1, \ldots, c^0_k$ quindi i centri iniziali per Y sono $g^0_1, \ldots, g^0_k$ dove $g^0_i = Ac^0_i + b$ .

Finora l'ho pensato $A$ deve essere al massimo e $b$ può essere qualsiasi vettore. Tuttavia, non sono stato in grado di dimostrarlo.

algorithms clustering

— Ana Echavarria
fonte

La risposta dipende dall'algoritmo K-mean, ma ciò che segue dovrebbe funzionare per gli algoritmi standard.

Otterrai lo stesso risultato se la tua trasformazione $T$ soddisfa due condizioni:

Mantiene le distanze: $d(z,w) = d(T(z),T(w))$ , dove $d$ è la tua metrica, diciamo $d(z,w) = \|z-w\|$ .
Conserva le medie: se è una combinazione convessa che . $\sum_i p_i z_i$ $T(\sum_i p_i z_i) = \sum_i p_i T(z_i)$

Puoi verificarlo andando sull'algoritmo, dimostrando che fa sempre le stesse scelte.

— Yuval Filmus
fonte

Grazie Yuval, questo ha molto senso. Ciò significherebbe quindi che per la distanza euclidea, A dovrebbe essere una matrice ortogonale per creare una trasformazione rigida?

— Ana Echavarria,

Sembra proprio così.

— Yuval Filmus,