Gli autoencoder possono essere utilizzati per l'apprendimento supervisionato?


9

Gli autoencoder possono essere utilizzati per l'apprendimento supervisionato senza aggiungere un livello di output ? Possiamo semplicemente alimentarlo con un vettore di input-output concatenato per l'addestramento e ricostruire la parte di output dalla parte di input quando facciamo l'inferenza? La parte di output verrebbe trattata come valori mancanti durante l'inferenza e verrebbe applicata una certa imputazione.


Non capisco bene. Se lo alleni con vettori di input-output, avrai anche bisogno di vettori di output mentre fai l'inferenza per alimentarlo alla rete. Che cosa hai intenzione di fare al riguardo?
Didam I

No, verrebbero trattati come valori mancanti e imputati in qualche modo. Il codificatore automatico proverà quindi a ricostruirlo (potrebbero essere necessarie più iterazioni). La domanda riguarda proprio la fattibilità di questa idea. Modificherò per chiarire.
rcpinto,

Risposte:


2

Uno di questi documenti che conosco e che ho implementato è l' apprendimento semi-supervisionato che utilizza le reti ladder . Cito qui la loro descrizione del modello:

Il nostro approccio segue Valpola (2015), che ha proposto una rete Ladder in cui il compito ausiliario è quello di denunciare le rappresentazioni ad ogni livello del modello. La struttura del modello è un auto-codificatore con salta le connessioni dall'encoder al decodificatore e il compito di apprendimento è simile a quello del denoising degli auto-codificatori ma applicato a tutti i livelli, non solo agli input. Le connessioni skip allevia la pressione per rappresentare i dettagli negli strati superiori del modello perché, tramite le connessioni skip, il decodificatore può recuperare tutti i dettagli scartati dall'encoder.

Per ulteriori spiegazioni sull'architettura, consultare Deconstructing the Ladder Network Architecture di Yoshua Bengio.


1

Ricordo di aver letto articoli su tali sistemi, se ti capisco correttamente, ma al momento non riesco a ricordare i titoli.

L'idea era di usare RNN generativi basati sui caratteri, addestrarli su sequenze codificate come "datadatadatadata | answer", e quindi quando si alimentava in "otherdatadata |" quindi continuerebbe a generare una sorta di risposta prevista.

Ma, per quanto ricordo, questa era solo un'illustrazione chiara poiché se avessi i dati per fare qualcosa sotto supervisione, otterrai risultati migliori con metodi convenzionali.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.