Come posso estrarre il testo dalle immagini?

Non sto parlando di file scannerizzati, ma di immagini di varietà da giardino, come quando si scatta una foto ad alta definizione di una lavagna in classe, ed è ben scritta a mano; o quando fotografi una pagina da un ricettario e desideri la ricetta in formato testo.

Qualche software gratuito e aperto per questo?

Ho provato a tesseract e i risultati sono stati orribili.

software-recommendation images ocr

— Strapakowsky
fonte

Ho bisogno di un OCR che supporti contemporaneamente bengalese e inglese.

— alhelal

Risposte:

Si chiama l'atto di estrarre il testo dalle immagini OCRe Ubuntu ha una pagina wiki dedicata all'OCR . Da quella pagina:

Strumenti OCR disponibili

I repository di Ubuntu Universe contengono i seguenti strumenti OCR:

gocr - Un OCR a riga di comando
fuzzyocr - plugin spamassassin per controllare gli allegati delle immagini
libhocr0 - OCR ebraico
ocrad - Programma di riconoscimento ottico dei caratteri
ocrfeeder - Analisi del layout del documento e sistema di riconoscimento ottico dei caratteri
ocropus - analisi dei documenti e sistema OCR
tesseract-ocr

I repository multiverso di Ubuntu contengono anche:

cuneiforme - sistema OCR multilingue

Alcuni pacchetti sono obsoleti, ma quelli nuovi non ufficiali sono disponibili in Alex_P PPA (codice aggiunta PPA: ppa: alex-p / notesalexp). Se non hai mai usato un PPA, controlla come aggiungere software da un PPA .

modifica: Come mostrato nel commento, esiste anche l' OCR Clara , ma ha avuto problemi con Hardy e il loro sito web ha il 2009 come ultimo aggiornamento.

— Rinzwind
fonte

Hai esperienza con qualcuno di questi per gli esempi che ho descritto? Sono diventato un po 'scettico nei confronti dei normali strumenti ocr per loro. Il numero 7 della lista è quello che ho provato ed è stato chiaramente terribile.

— Strapakowsky,

Se ricordo, ho provato anche Gocr, con risultati terribili equivalenti. Se hai provato con successo uno di questi, quale sintassi hai usato? Grazie.

— Strapakowsky,

Assolutamente no! Non ho mai preso la briga con OCR: D Freshmeat ricerca spettacoli Clara OCR e Tesseract OCR-;) ( freshmeat.net/search/... )

— Rinzwind

Sbaglio se dico che un uso corretto dell'OCR richiede la conoscenza del processo e un'attenta configurazione per adattarsi alla particolare immagine da scansionare? Pertanto, se ho ragione, i risultati negativi potrebbero essere dovuti all'utente e non al software.

— NN,

OCRfunziona meglio se sai come viene creata l'immagine e sei molto esperto nell'uso del software che usi (quest'ultimo è il motivo per cui non sono mai riuscito a usarlo).

— Rinzwind,

tesseract-ocrsarebbe il migliore rispetto a tutti gli altri. Per l'installazione, eseguire il comando sudo apt-get install tesseract-ocr.

L'uso è tesseract filename.jpg output.txt.

Il comando sopra genererà output.txt.

Potresti considerare di selezionare la lingua appropriata. In tal caso dovrai installare il tesseract-ocr-LANGpacchetto, dove si LANGtrova il codice lingua ISO 639-2 di tre lettere . In questo momento hai 123 lingue sul repository 18.04. Quindi utilizzare ad esempio:

tesseract mySpanishText.jpg output -l spa

— Sudhir Belagali
fonte

Ehi, quindi funziona, ma non è preciso o preferirei dire che è preciso all'80-85%. Come esempio per questa immagine: pbs.twimg.com/media/DJs6_pcXkAA2VrN.jpg , ha incasinato $ sign e anche la maggior parte delle parentesi. Quadrato, rotondo, riccio, tutte le parentesi sono un problema, non vengono mai estratte correttamente. Conosci qualche soluzione?

— Milano Chheda,