Come fa a recaptcha a sapere che non stai inserendo traduzioni fasulle delle immagini [chiuso]


22

Da quello che ho capito, i captcha sono testi che sono stati distorti dall'applicazione di filtri, rumore e altri algoritmi miscelativi. Pertanto, per scoprire se la capacità di lettura della persona è quella di una persona, si confronta ciò che hanno risposto a ciò che è la risposta conosciuta.

Ora, leggendo su ReCaptcha, dice che le parole visualizzate sono quelle che non possono essere tradotte dall'OCR. Inoltre, recaptcha viene utilizzato per tradurre quelle immagini. Come può sapere se hai davvero ragione nella lettura o stai solo inventando qualcosa?

Se sapesse cosa diceva, non sarebbe stato usato in ricaptcha come materiale di traduzione. Se non sa cosa dice il testo, come convalida la tua risposta?

Immagino che questa sia probabilmente un'analisi basata sulla probabilità con enormi dimensioni del campione prima di contrassegnare qualsiasi cosa tradotta.

Qualcuno sa dove si trova la risposta?


3
Di interesse è lo scherzo 4chan / anonimo sul sondaggio Time. "La torta di marmo, anche il gioco", che ha sfruttato i difetti nella verifica del crowdsourcing della seconda parola.
DanBeale,

Risposte:


33

Le pagine del libro vengono sostanzialmente scansionate fotograficamente, quindi trasformate in testo usando "Riconoscimento ottico dei caratteri" (OCR) e inviate al Web sotto forma di un'immagine con una parola nota al programma per computer dietro reCAPTCHA e una parola che non lo è ancora noto.

L'utente quindi digita entrambe le parole e se risolve quella per cui è nota la risposta, il sistema assume che la risposta sia corretta per quella nuova. Il sistema fornisce quindi la nuova immagine a un numero di altre persone per determinare, con maggiore sicurezza, se la risposta originale era corretta. Pertanto, il sistema è un servizio di auto-miglioramento che migliora nel tempo.

http://www.google.com/recaptcha/learnmore


22

Ecco perché reCaptcha ti ha inserito due parole. Una delle parole è già nota e una delle parole non è nota. Se passi o meno il captcha dipende solo da come rispondi per la parola conosciuta. La tua risposta per l'altra parola (sconosciuta) verrà utilizzata, insieme ad altre risposte alla stessa parola, anche per trasformarla in una parola nota.


4
... ed è anche per questo che nel tempo diventa sempre più frustrante da usare e ti convince che sei un idiota / robot quando fallisci per la quinta volta consecutiva. :-(
Sirex

Strano ... non ho mai fallito quello che ricordo, forse solo fortuna da parte mia.
Paolo,

@Sirex Lo pensavo, ma poi mi sono reso conto che questo è vero solo se la dimensione del testo del corpus è costante o si riduce rispetto alle voci captcha dei numeri. La verità è che il testo corpus sta crescendo ... la domanda è se quella crescita sia al passo con la crescita nell'uso generale del captcha.
Joel Coehoorn,

sì, credo. Ho visto un sacco di reCaptchas che sono semplicemente follemente difficili. Dove anche la parola conosciuta è ambigua.
Sirex,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.