Chiedi all'etichetta utente di evidenziare oggetti nel video che un classificatore all'avanguardia non è in grado di risolvere
Crea un classificatore video all'avanguardia. Potrebbe anche addestrarlo sui dati di formazione video di YouTube-8M di Google . Ma vorrai alimentare continuamente anche il video originale.
Avere l'etichetta classificatore quanti più oggetti possibile. Fai isolare quali oggetti può riconoscere come oggetti ma quali non è in grado di etichettare.
Hanno in uscita video che delinea gli oggetti. Preferibilmente GIF, che possono essere facilmente incorporati nei moduli.
Per 100 di questi, chiedi a 100 utenti quale sia l'oggetto. Se il 90% degli utenti concorda sul nome di un oggetto, aggiungi quel video al set captcha. Chiamalo set pre-allenato.
Ogni volta che un utente deve autenticarsi, mostra loro uno degli oggetti evidenziati in un video non dal set pre-addestrato . Se l'immagine ha meno di 100 proiezioni, registra l'etichetta e dagli un'altra all'utente dal set pre-addestrato. Se lo fanno bene, lasciali passare, in caso contrario, dagliene un altro dal set predefinito.
Una volta che il video non pre-addestrato ha più di 100 proiezioni e oltre il 90% degli utenti captcha è d'accordo, aggiungi quel video al set post-training.
Nel tempo, rimuovere lentamente il set pre-allenato. Inserisci le scadenze su ogni video nel set post-training e rimuovile dopo la scadenza, in modo che non vengano utilizzate troppe volte.
Idealmente, questo processo migliorerebbe costantemente il classificatore video, mantenendolo all'avanguardia e leggermente più avanti rispetto agli altri classificatori. Forse potrebbe anche favorire parole e oggetti meno comuni e cose più esoteriche, in modo da specializzare questo classificatore rispetto ad altri classificatori.
Lo stesso si potrebbe fare per l'etichettatura delle immagini, ma l'utilità del classificatore video probabilmente durerà più a lungo, dati i progressi nell'IA.
A rigor di termini, tuttavia, a parte qualche inganno quantico, non esiste un sistema captcha che un giorno non sarà risolto da sistemi di intelligenza artificiale esterni.
(modifica: oh, ho appena notato che hai detto specificamente "captcha testuale". Se questo è ciò che intendi, allora no, non penso che la classificazione del testo abbia ancora molto mistero in esso. I computer possono probabilmente raccogliere il testo dalle immagini meglio degli umani ora. Ma tecnicamente, l' ingresso nel sistema captcha sopra descritto è testuale.)