Supponiamo che io abbia una serie di segnali nel dominio del tempo senza assolutamente etichette . Voglio raggrupparli in 2 o 3 classi. I codificatori automatici sono reti senza supervisione che imparano a comprimere gli input. Quindi, dato un input , pesi e , distorsioni b_1 e b_2 e output \ hat {x} ^ {(i)} , possiamo trovare le seguenti relazioni:
Quindi sarebbe una forma compressa di e la ricostruzione di quest'ultimo. Fin qui tutto bene.
Quello che non capisco è come questo potrebbe essere usato per il clustering (se c'è un modo per farlo). Ad esempio, nella prima figura di questo documento , c'è uno schema a blocchi che non sono sicuro di aver capito. Utilizza come input per la rete feed-forward, ma non viene menzionato il modo in cui tale rete viene addestrata. Non so se c'è qualcosa che sto ignorando o se il documento è incompleto. Inoltre, questo tutorial alla fine mostra i pesi appresi dall'auto-codificatore e sembrano essere dei kernel che una CNN imparerebbe a classificare le immagini. Quindi ... immagino che i pesi dell'autoencoder possano essere usati in qualche modo in una rete feed-forward per la classificazione, ma non sono sicuro di come.
I miei dubbi sono:
- Se è un segnale nel dominio del tempo di lunghezza (ovvero ), può anche solo un vettore? In altre parole, avrebbe senso che fosse una matrice con una delle sue dimensioni maggiore di ? Credo che non lo farebbe, ma voglio solo controllare.
- Quale di queste quantità sarebbe l'input per un classificatore? Ad esempio, se voglio usare un MLP classico che ha tante unità di output quante sono le classi in cui voglio classificare i segnali, cosa dovrei inserire all'ingresso di questa rete completamente connessa ( , , qualsiasi altra cosa)?
- Come posso usare i pesi e le inclinazioni apprese in questo MLP? Ricorda che abbiamo presupposto che non siano assolutamente disponibili etichette , quindi è impossibile addestrare la rete. Penso che i dotti e dovrebbero essere utili in qualche modo nella rete completamente connessa, ma non vedo come usarli.
Osservazione: nota che ho usato un MLP come esempio perché è l'architettura più elementare, ma la domanda si applica a qualsiasi altra rete neurale che potrebbe essere usata per classificare i segnali nel dominio del tempo.