Ho studiato metodi di apprendimento semi-supervisionati e mi sono imbattuto nel concetto di "pseudo-etichettatura".
A quanto ho capito, con la pseudo-etichettatura hai una serie di dati etichettati e una serie di dati senza etichetta. Per prima cosa si addestra un modello solo sui dati etichettati. Quindi utilizzare tali dati iniziali per classificare (allegare etichette provvisorie a) i dati senza etichetta. In seguito, inserisci i dati etichettati e non etichettati nella formazione del tuo modello, adattandoti alle etichette note e alle etichette previste. (Iterate questo processo, ri-etichettando con il modello aggiornato.)
I vantaggi dichiarati sono che è possibile utilizzare le informazioni sulla struttura dei dati senza etichetta per migliorare il modello. Viene spesso mostrata una variazione della figura seguente, "dimostrando" che il processo può prendere un limite decisionale più complesso in base a dove si trovano i dati (senza etichetta).
Immagine da Wikimedia Commons di Techerin CC BY-SA 3.0
Tuttavia, non sto ancora acquistando quella spiegazione semplicistica. Ingenuamente, se il risultato della formazione solo etichettato originale fosse il limite superiore della decisione, le pseudo-etichette sarebbero assegnate in base a quel limite decisionale. Vale a dire che la mano sinistra della curva superiore sarebbe pseudo-etichettata bianca e la mano destra della curva inferiore sarebbe pseudo-etichettata nera. Dopo la riqualificazione non otterresti il bel confine di decisione curvo, poiché le nuove pseudo-etichette rafforzerebbero semplicemente il confine di decisione corrente.
O, per dirla in altro modo, l'attuale limite di sola etichettatura avrebbe una perfetta precisione di previsione per i dati senza etichetta (poiché è quello che abbiamo usato per crearli). Non esiste una forza motrice (nessun gradiente) che ci indurrebbe a cambiare la posizione di quel confine di decisione semplicemente aggiungendo i dati pseudo-etichettati.
Sono corretto nel pensare che manchi la spiegazione rappresentata dal diagramma? O c'è qualcosa che mi manca? In caso contrario, qual è il vantaggio delle pseudoetichettature, dato che il limite decisionale pre-riqualificazione ha una perfetta precisione rispetto alle pseudoetichettature?