A cosa serve t-SNE, a parte la visualizzazione dei dati?


12

In quali situazioni dovremmo usare t-SNE (oltre alla visualizzazione dei dati)?

T-SNE viene utilizzato per la riduzione della dimensionalità. La risposta a questa domanda suggerisce che t-SNE dovrebbe essere usato solo per la visualizzazione e che non dovremmo usarlo per il clustering. Allora a che serve t-SNE?


6
Il consiglio standard è di NON usare tsne per il clustering, perché i cluster sono così dipendenti dalla perplessità. Dovrebbe essere usato solo per la "visualizzazione". Ma questo non è molto chiaro per me, poiché uno cerca immediatamente (e vede) i cluster quando guarda un complotto tsne. Quindi la tua domanda è buona: a cosa serve tsne?
generic_user

2
Vedi la risposta a questa domanda che ho posto: stats.stackexchange.com/questions/263539/…
generic_user

come ha detto @generic_user, voglio conoscere i vantaggi di t-sne, oltre alla visualizzazione.
Wolff

Non so perché questo sia stato chiuso come duplicato. OP sta chiedendo quali sono gli usi utili di t-sne oltre alla visualizzazione. Il thread collegato riguarda tutto il clustering. Ma potrebbero esserci altri usi.
amoeba,

Risposte:


4

La risposta a questa domanda suggerisce che la t-END deve essere utilizzato solo per la visualizzazione e che dovremmo non usarlo per il clustering. Allora a che serve t-SNE?

Non sono d'accordo con questa conclusione. Non vi è motivo di ritenere che t-SNE sia universalmente peggiore di qualsiasi altro algoritmo di clustering. Ogni algoritmo di clustering fa ipotesi sulla struttura dei dati e ci si può aspettare che funzionino in modo diverso a seconda della distribuzione sottostante e dell'uso finale della ridotta dimensionalità.

t-SNE come molti algoritmi di apprendimento senza supervisione spesso forniscono un mezzo per raggiungere un fine, ad esempio ottenere una comprensione precoce della separabilità dei dati, verificare che abbia una struttura identificabile e ispezionare la natura di questa struttura. Non è necessario visualizzare l'output di t-SNE per iniziare a rispondere ad alcune di queste domande. Altre applicazioni di incorporamenti di dimensioni inferiori includono funzioni di costruzione per la classificazione o l'eliminazione della multi-collinearità per migliorare le prestazioni dei metodi di previsione.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.