Modifica finale con tutte le risorse aggiornate:
Per un progetto, sto applicando algoritmi di apprendimento automatico per la classificazione.
Sfida: dati etichettati piuttosto limitati e molti più dati senza etichetta.
obiettivi:
- Applica una classificazione semi-supervisionata
- Applicare in qualche modo un processo di etichettatura semi-supervisionato (noto come apprendimento attivo)
Ho trovato molte informazioni da articoli di ricerca, come l'applicazione di EM, Transductive SVM o S3VM (Semi Supervised SVM), o in qualche modo usando LDA, ecc. Persino ci sono pochi libri su questo argomento.
Domanda: dove sono le implementazioni e le fonti pratiche?
Aggiornamento finale (basato sugli aiuti forniti da mpiktas, bayer e Dikran Marsupial)
Apprendimento semi supervisionato:
- TSVM: in SVMligth e SVMlin .
- EM Naive Bayes in Python
- EM nel progetto LinePipe
Apprendimento attivo:
- Dualist : un'implementazione dell'apprendimento attivo con codice sorgente sulla classificazione del testo
- Questa pagina web offre una meravigliosa panoramica dell'apprendimento attivo.
- Un laboratorio di progettazione sperimentale: qui .
Apprendimento approfondito:
- Video introduttivo qui .
- Sito generale .
- Tutorial Stanford Unsupervised Feature Learning e Deep Learning .