Prima una breve risposta, quindi un commento più lungo:
Risposta
Le tecniche SNE calcolano una matrice di somiglianza N × N sia nello spazio di dati originale sia nello spazio di incorporamento a bassa dimensione in modo tale che le somiglianze formino una distribuzione di probabilità su coppie di oggetti. In particolare, le probabilità sono generalmente date da un kernel gaussiano normalizzato calcolato dai dati di input o dall'incorporamento. In termini di classificazione, ciò fa immediatamente venire in mente metodi di apprendimento basati su istanze . Ne hai elencato uno: SVM con RBF e @amoeba ha elencato kNN. Esistono anche reti di funzioni di base radiale , di cui non sono esperto.
Commento
Detto questo, sarei doppiamente attento a fare inferenze su un set di dati solo guardando i grafici t-SNE. t-SNE non si concentra necessariamente sulla struttura locale. Tuttavia, puoi regolarlo per farlo sintonizzando il perplexity
parametro, che regola (liberamente) come bilanciare l'attenzione tra gli aspetti locali e globali dei tuoi dati.
In questo contesto, di per perplexity
sé è una pugnalata nel buio su quanti vicini vicini può avere ogni osservazione ed è fornita dall'utente. L' articolo originale afferma: "Le prestazioni di t-SNE sono abbastanza robuste rispetto ai cambiamenti nella perplessità, e i valori tipici sono compresi tra 5 e 50". Tuttavia, la mia esperienza è che ottenere il massimo da t-SNE può significare analizzare più grafici con diverse perplessità.
In altre parole, ottimizzando learning rate
e perplexity
, è possibile ottenere grafici 2D dall'aspetto molto diverso per lo stesso numero di fasi di allenamento e utilizzando gli stessi dati.
Questo documento di distillazione Come utilizzare t-SNE fornisce in modo efficace un ottimo riepilogo delle insidie comuni dell'analisi t-SNE. I punti di riepilogo sono:
Questi iperparametri (ad es. Tasso di apprendimento, perplessità) contano davvero
Le dimensioni del cluster in un diagramma t-SNE non significano nulla
Le distanze tra i cluster potrebbero non significare nulla
Il rumore casuale non sembra sempre casuale.
Puoi vedere alcune forme, a volte
Per la topologia, potrebbe essere necessario più di un grafico
In particolare dai precedenti punti 2, 3 e 6, ci penserei due volte a fare inferenze sulla separabilità dei dati osservando i singoli grafici t-SNE. Esistono molti casi in cui è possibile "produrre" grafici che mostrano cluster chiari utilizzando i parametri giusti.