I dati devono essere centrati + ridimensionati prima di applicare t-SNE?


18

Alcune funzionalità dei miei dati hanno valori elevati, mentre altre hanno valori molto più piccoli.

È necessario centrare + ridimensionare i dati prima di applicare t-SNE per evitare distorsioni verso valori più grandi?

Uso l'implementazione sklearn.manifold.TSNE di Python con la metrica di distanza euclidea predefinita.

Risposte:


18

Il centraggio non dovrebbe importare poiché l'algoritmo opera solo su distanze tra punti, tuttavia il riscalamento è necessario se si desidera che le diverse dimensioni vengano trattate con uguale importanza, poiché la 2-norma sarà maggiormente influenzata da dimensioni con grande varianza.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.