Domanda
Sono molto interessato al metodo Eigenmaps Laplaciano. Attualmente lo sto usando per ridurre le dimensioni dei miei set di dati medici.
Tuttavia, ho riscontrato un problema utilizzando il metodo.
Ad esempio, ho alcuni dati (segnali spettri) e posso usare PCA (o ICA) per ottenere alcuni PC (o IC). Il problema è come ottenere componenti con dimensioni ridotte simili dei dati originali usando LE?
Secondo il metodo delle eigenmaps lappacee, dobbiamo risolvere il problema degli autovalori generalizzati, che è
Qui è l'autovettore. Se tracciamo per esempio i primi 3 autovettori (la soluzione secondo 3 autovalori), i risultati non sono interpretabili.
Tuttavia, quando tracciamo i primi 3 PC e i primi 3 circuiti integrati, i risultati sembrano sempre rappresentare chiaramente (visivamente) i dati originali .
Suppongo che il motivo sia perché la matrice è definita dalla matrice del peso (matrice di adiacenza ) e i dati sono stati adattati con il kernel di calore per creare , che utilizza una funzione esponenziale. La mia domanda è: come recuperare i componenti ridotti di (non l'autovettore della matrice )?
Dati
Il mio set di dati è limitato e non è facile dimostrare il problema. Qui ho creato un problema con i giocattoli per mostrare cosa intendevo e cosa volevo chiedere.
Si prega di vedere l'immagine,
In primo luogo, creo alcune onde sinusoidali A, B, C mostrate in curve rosse (prima colonna della figura). A, B e C hanno 1000 campioni, in altre parole, salvati in vettori 1x1000.
In secondo luogo, ho mescolato le fonti A, B, C usando combinazioni lineari create casualmente, ad es. , in cui sono valori casuali. Il segnale misto è in uno spazio dimensionale molto elevato, ad es. , 1517 è uno spazio tridimensionale scelto casualmente. Mostro solo le prime tre file del segnale M in curve verdi (seconda colonna della figura).
Successivamente, eseguo PCA, ICA e eigenmaps Laplacian per ottenere i risultati della riduzione dimensionale. Ho scelto di usare 3 PC, 3 IC e 3 LE per fare un confronto equo (le curve blu mostrate rispettivamente come 3a, 4a e ultima colonna della figura).
Dai risultati di PCA e ICA (terza, quarta colonna della figura), possiamo vedere che possiamo interpretare i risultati come una riduzione della dimensione, cioè, per i risultati ICA, possiamo recuperare il segnale misto di (Non sono sicuro che possiamo ottenere anche con risultati PCA ma il risultato mi sembra giusto).
Tuttavia, per favore guarda i risultati di LE, riesco a malapena a interpretare i risultati (ultima colonna della figura). Sembra qualcosa di "sbagliato" con i componenti ridotti. Inoltre, voglio menzionare che alla fine la trama dell'ultima colonna è l'autovettore nella formula
La gente ha più idee?
La Figura 1 che utilizza 12 vicini più vicini e sigma nel kernel di riscaldamento è 0,5:
La Figura 2 che utilizza 1000 vicini più vicini e sigma nel kernel di riscaldamento è 0,5:
Sourcecode: codice Matlab con pacchetto richiesto