Ci sono sfide testuali CAPTCHA che possono ingannare l'IA, ma non l'essere umano?

10

Esistono tecniche moderne per generare sfide testuali CAPTCHA (quindi la persona deve digitare il testo giusto) che possono facilmente ingannare l'IA con alcuni metodi di offuscamento visivo, ma allo stesso tempo l'essere umano può risolverli senza alcuna lotta?

Ad esempio sto parlando della semplice capacità di riconoscere il testo incorporato nell'immagine (senza considerare alcun plugin esterno come Flash o Java, classificazione dell'immagine, ecc.) E riscrivere il testo che è stato scritto o qualcosa di simile.

Immagino che aggiungere rumore, sfumatura, ruotare le lettere o cambiare i colori non sia più un metodo affidabile, poiché possono essere rapidamente rotti.

Qualche suggerimento o ricerca è stata fatta?

image-recognition research ocr

— kenorb
fonte

4

Non è questo tipo di arretramento? Di solito qualcuno prima fa un Captcha che pensa possa ingannare un robot, POI altre persone iniziano a lavorare per risolverlo automaticamente. Tutto ciò che potresti pensare diventerà obsoleto molto rapidamente.

— Disincantato Lurker il

Prova a pensare a ciò che gli umani possono fare meglio dei computer. Possiamo ragionare e noi (madrelingua) sapremo quasi ogni linguaggio. Vedi questo per ulteriori idee . Penso che per quanto riguarda il testo, il migliore sarebbe che l'utente inserisca il testo che viene analizzato con la PNL per abbinare un sentimento dichiarato o forse esprimere qualcosa. I computer non sono molto bravi a redigere frasi chiare e ben strutturate (ma immagino che la maggior parte degli umani non sia brava in questo).

— JakeD,

Normalmente CAPTCHA testuale è usato per indicare che CATPCHA è presentato come testo, non che l'input dell'utente richiesto deve essere testo. Ad esempio TextCaptcha .

— Theraot,

5

È una domanda interessante su ciò che rende unici gli esseri umani. C'è un buon libro sull'argomento intitolato What Computers Cant Do di Hubert Dreyfus .

Un'attività che un computer non può gestire (almeno per ora) è classificare le cose importanti. Ad esempio, CAPTCHA ti chiede di ordinare un elenco casuale di cose (uno piccolo, cinque o sei articoli) per importanza. Questo particolare esercizio richiede all'IA di prendere decisioni (non sempre razionali) basate sul giudizio umano.

— kvfi
fonte

5

Un metodo che potrebbe eventualmente funzionare consiste nell'utilizzare illusioni ottiche come una in cui due linee lungo un corridoio sono identiche ma una sembra più lunga all'occhio umano, quindi potrebbero essere spinti con una domanda a scelta multipla sullo stato della linea, che per i nostri occhi sembrano più lunghi, ma per un computer ha ancora la stessa lunghezza della linea. Certo, c'è sempre il problema delle persone con disabilità oculari che non sono in grado di completarle, ma diverse illusioni potrebbero essere utilizzate per adattarle.

Esempio

— sgtdragonfire
fonte

2

Chiedi all'etichetta utente di evidenziare oggetti nel video che un classificatore all'avanguardia non è in grado di risolvere

Crea un classificatore video all'avanguardia. Potrebbe anche addestrarlo sui dati di formazione video di YouTube-8M di Google . Ma vorrai alimentare continuamente anche il video originale.

Avere l'etichetta classificatore quanti più oggetti possibile. Fai isolare quali oggetti può riconoscere come oggetti ma quali non è in grado di etichettare.

Hanno in uscita video che delinea gli oggetti. Preferibilmente GIF, che possono essere facilmente incorporati nei moduli.

Per 100 di questi, chiedi a 100 utenti quale sia l'oggetto. Se il 90% degli utenti concorda sul nome di un oggetto, aggiungi quel video al set captcha. Chiamalo set pre-allenato.

Ogni volta che un utente deve autenticarsi, mostra loro uno degli oggetti evidenziati in un video non dal set pre-addestrato . Se l'immagine ha meno di 100 proiezioni, registra l'etichetta e dagli un'altra all'utente dal set pre-addestrato. Se lo fanno bene, lasciali passare, in caso contrario, dagliene un altro dal set predefinito.

Una volta che il video non pre-addestrato ha più di 100 proiezioni e oltre il 90% degli utenti captcha è d'accordo, aggiungi quel video al set post-training.

Nel tempo, rimuovere lentamente il set pre-allenato. Inserisci le scadenze su ogni video nel set post-training e rimuovile dopo la scadenza, in modo che non vengano utilizzate troppe volte.

Idealmente, questo processo migliorerebbe costantemente il classificatore video, mantenendolo all'avanguardia e leggermente più avanti rispetto agli altri classificatori. Forse potrebbe anche favorire parole e oggetti meno comuni e cose più esoteriche, in modo da specializzare questo classificatore rispetto ad altri classificatori.

Lo stesso si potrebbe fare per l'etichettatura delle immagini, ma l'utilità del classificatore video probabilmente durerà più a lungo, dati i progressi nell'IA.

A rigor di termini, tuttavia, a parte qualche inganno quantico, non esiste un sistema captcha che un giorno non sarà risolto da sistemi di intelligenza artificiale esterni.

(modifica: oh, ho appena notato che hai detto specificamente "captcha testuale". Se questo è ciò che intendi, allora no, non penso che la classificazione del testo abbia ancora molto mistero in esso. I computer possono probabilmente raccogliere il testo dalle immagini meglio degli umani ora. Ma tecnicamente, l' ingresso nel sistema captcha sopra descritto è testuale.)

— Doxosophoi
fonte