Supervisione a distanza: supervisionato, semi-supervisionato o entrambi?


20

La "supervisione a distanza" è uno schema di apprendimento in cui viene appreso un classificatore in base a un set di formazione debolmente etichettato (i dati di training vengono etichettati automaticamente in base a euristiche / regole). Penso che sia l'apprendimento supervisionato sia l'apprendimento semi-supervisionato possano includere tale "supervisione a distanza" se i loro dati etichettati sono euristicamente / automaticamente etichettati. Tuttavia, in questa pagina , "supervisione a distanza" è definita come "apprendimento semi-supervisionato" (vale a dire, limitato a "semi-supervisione").

Quindi la mia domanda è: "supervisione a distanza" si riferisce esclusivamente alla semi-supervisione? Secondo me può essere applicato sia all'apprendimento supervisionato che semi-supervisionato. Fornire eventuali riferimenti affidabili, se presenti.

Risposte:


22

Un algoritmo di supervisione a distanza di solito prevede i seguenti passaggi:
1] Potrebbe avere alcuni dati di addestramento etichettati
2] Ha "accesso" a un pool di dati senza etichetta
3] Ha un operatore che gli consente di campionare da questi dati senza etichetta ed etichettarli e questo operatore dovrebbe essere rumoroso nelle sue etichette
4] L'algoritmo quindi utilizza collettivamente i dati di addestramento etichettati originali se presenti e questi nuovi dati rumorosamente etichettati per fornire l'output finale.

Ora, per rispondere alla tua domanda, tu e il sito entrambi avete ragione. Stai osservando il quarto passaggio dell'algoritmo e noti che al quarto passaggio è possibile utilizzare qualsiasi algoritmo a cui l'utente ha accesso. Da qui il tuo punto "può essere applicato sia all'apprendimento supervisionato che semi-supervisionato" .

Considerando che il sito sta esaminando tutti i passaggi 1-4 collettivamente e nota che i dati rumorosamente etichettati sono ottenuti da un pool di dati non etichettati (con o senza l'uso di alcuni dati di formazione etichettati preesistenti) e questo processo per ottenere etichette rumorose è un componente essenziale per qualsiasi algoritmo di supervisione distante, quindi è un algoritmo semi-supervisionato.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.