Buon OCR gratuito con GUI per correggere errori? (per Windows)

Ho usato SimpleOCR , che ha una bella interfaccia grafica per correggere gli errori. Sfortunatamente commette molti errori! (e subisce altri bug e limitazioni)

D'altra parte Tesseract è più preciso ma non ha alcuna GUI.

La mia domanda è: esiste un programma OCR gratuito per Windows che ha una buona interfaccia grafica e un basso tasso di errore? Voglio che evidenzi le parole sospette (per incertezza OCR, non solo il controllo ortografico) e mostri la parola originale (bitmap) mentre sto modificando la parola OCR in modo simile a quello che fa SimpleOCR.

L'open-source sarebbe il migliore, seguito dal freeware, quindi prova / demo / crippleware molto indietro.

Schermata SimpleOCR che mostra la GUI per la correzione degli errori

windows gui ocr

— Hugh Allen
fonte

possibile duplicato del software OCR gratuito

— Sathyajith Bhat

@Sathya: i miei requisiti specifici lo differenziano da quella domanda.

— Hugh Allen,

Non esattamente gratuito, ma hai guardato in Microsoft Office? Viene fornito con OCR. (Cercare la funzionalità "Document Imaging di Microsoft Office"

— nell'installazione

@horsedrowner: l'ho appena provato. La sua precisione è paragonabile a Tesseract ma richiede un file TIFF con le impostazioni DPI appropriate o non funziona e non ha un'interfaccia per correggere gli errori OCR.

— Hugh Allen,

@Hugh Allen: vero? Ha funzionato abbastanza bene quando mi sono imbattuto nella funzione del menu di scelta rapida in OneNote 2007. E stavo usando un file di immagine casuale copiato e incollato da un sito Web ...

— Vivelin

Risposte:

Hai provato Gimagereader , un fronte gui per Tesseract?

— ukanth
fonte

L'ho appena provato (sotto Windows) e non funziona per me - il processo termina immediatamente senza un messaggio di errore :( Comunque guardando le schermate non sembra evidenziare effettivamente la parola che stai modificando. Hai provato vero?

— Hugh Allen,

OCRopus :

Il software si basa in parte su Tesseract, il miglior motore OCR open source disponibile per ora. Mentre il progetto dovrebbe essere rilasciato alla fine del prossimo anno e verrà utilizzato per il progetto di scansione dei libri di Google, il team ha in mente alcune interessanti applicazioni:

un'interfaccia del servizio web

PDF, videocamera e schermo OCR

integrazione con strumenti di ricerca desktop: Beagle, Spotlight, Google Desktop

OCRopus (tm) è un sistema di analisi dei documenti e OCR all'avanguardia, con analisi del layout innestabile, riconoscimento dei caratteri innestabili, modellistica statistica del linguaggio naturale e capacità multilingue.

Il motore OCRopus si basa su due progetti di ricerca: un riconoscimento della calligrafia ad alte prestazioni sviluppato a metà degli anni '90 e distribuito dall'Ufficio censimento degli Stati Uniti e nuovi metodi di analisi del layout ad alte prestazioni.

Lo sviluppo di OCRopus è sponsorizzato da Google ed è inizialmente destinato a sforzi di conversione di documenti ad alto rendimento e ad alto volume. Prevediamo che sarà anche un eccellente sistema OCR per molte altre applicazioni. link:

GOCR

GOCR è un programma OCR (Optical Character Recognition), sviluppato sotto licenza GNU Public License. Converte le immagini scansionate del testo in file di testo. Joerg Schulenburg ha avviato il programma e ora guida un team di sviluppatori. GOCR può essere utilizzato con diversi front-end, il che rende molto facile il porting su diversi sistemi operativi e architetture. Può aprire molti formati di immagine diversi e la sua qualità è migliorata quotidianamente.

link:

GOCR

— Krazy_Kaos
fonte

Uno di questi ha una buona interfaccia grafica per andare con loro?

— Hugh Allen,

A cura di rispondere alla tua domanda .... ma direi: "No, non lo fanno", ma sento che abiword supporta OCRopus ( arstechnica.com/open-source/news/2007/08/… )

— Krazy_Kaos

+1 per l'aggiunta di schermate per rispondere e anche per la mini revisione dei due programmi offerti ...

— Kurt Pfeifle,

Esiste anche TOPOCR (alias SnapReader), contenente il correttore ortografico post-elaborazione per 11 lingue:

SnapReader può essere utilizzato per creare le tue note ricercabili da quasi tutte le immagini del documento. Oppure puoi usarlo come strumento di creazione e creare il tuo contenuto modificabile usando lo scanner o la fotocamera e salvare i risultati come HTML o PDF. SnapReader può anche trasformare il testo in audio di altissima qualità usando Audrey. Quindi non solo puoi utilizzare lo scanner o la fotocamera per acquisire documenti, ma ora puoi anche utilizzare il tuo lettore musicale portatile o lo smartphone per "leggerli".

Immagine

— harrymc
fonte