Apprendimento semi-supervisionato, apprendimento attivo e apprendimento profondo per la classificazione


19

Modifica finale con tutte le risorse aggiornate:

Per un progetto, sto applicando algoritmi di apprendimento automatico per la classificazione.

Sfida: dati etichettati piuttosto limitati e molti più dati senza etichetta.

obiettivi:

  1. Applica una classificazione semi-supervisionata
  2. Applicare in qualche modo un processo di etichettatura semi-supervisionato (noto come apprendimento attivo)

Ho trovato molte informazioni da articoli di ricerca, come l'applicazione di EM, Transductive SVM o S3VM (Semi Supervised SVM), o in qualche modo usando LDA, ecc. Persino ci sono pochi libri su questo argomento.

Domanda: dove sono le implementazioni e le fonti pratiche?


Aggiornamento finale (basato sugli aiuti forniti da mpiktas, bayer e Dikran Marsupial)

Apprendimento semi supervisionato:

Apprendimento attivo:

  • Dualist : un'implementazione dell'apprendimento attivo con codice sorgente sulla classificazione del testo
  • Questa pagina web offre una meravigliosa panoramica dell'apprendimento attivo.
  • Un laboratorio di progettazione sperimentale: qui .

Apprendimento approfondito:


Esiste un pacchetto R RTextTools . Se non sbaglio, implementa molti dei metodi che menzioni.
mpiktas,

Ciao mpiktas, grazie per il tuo gentile aiuto. È un toolkit interessante. Tuttavia, sembra che abbia a che fare solo con l'apprendimento supervisionato, mentre leggo "TextTools è un pacchetto di machine learning gratuito e open source per la classificazione automatica del testo che semplifica sia gli utenti principianti che avanzati per iniziare con l'apprendimento supervisionato. Il pacchetto include nove algoritmi per la classificazione degli ensemble (svm, slda, boosting, bagging, foreste casuali, glmnet, alberi decisionali, reti neurali, massima entropia) "
Flake,

Ok, ecco un altro tentativo: Weka . Gli autori hanno scritto un libro e il suo indice menziona l'apprendimento semi-supervisionato. Spero sinceramente che il capitolo non finisca con "... sfortunatamente nessuno di questi algoritmi è implementato in Weka" :)
mpiktas,

Drat, ho la versione precedente del libro! Grazie mille per aver segnalato questa fonte!
Flake,

Risposte:


8

Sembra che l'apprendimento profondo possa essere molto interessante per te. Questo è un campo molto recente di modelli di connessione profonda che sono pre-controllati in modo non supervisionato e successivamente perfezionati con la supervisione. La messa a punto richiede un numero molto inferiore di campioni rispetto al pretrattamento.

Per bagnarti la lingua, ti consiglio [Semantig Hashing Salakhutdinov, Hinton . Dai un'occhiata ai codici che trova per documenti distinti del corpus Reuters: (senza supervisione!)

inserisci qui la descrizione dell'immagine

Se hai bisogno di implementare del codice, dai un'occhiata a deeplearning.net . Tuttavia, non credo che ci siano soluzioni pronte all'uso.


Questa è un'informazione piuttosto interessante e nuova per me. Ovviamente l'implementazione immediata sarebbe migliore, ma questo mi aiuta davvero a conoscere qualcosa di più vicino a ciò che voglio. Grazie.
Flake,

5

Isabelle Guyon (e colleghi) hanno organizzato una sfida sull'apprendimento attivo qualche tempo fa, i lavori sono pubblicati qui (accesso aperto). Questo ha il vantaggio di essere abbastanza pratico e puoi confrontare direttamente le prestazioni di diversi approcci sotto un protocollo imparziale (in senso colloquiale) (la selezione casuale di schemi è sorprendentemente difficile da battere).


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.