Buon OCR gratuito con GUI per correggere errori? (per Windows)


9

Ho usato SimpleOCR , che ha una bella interfaccia grafica per correggere gli errori. Sfortunatamente commette molti errori! (e subisce altri bug e limitazioni)

D'altra parte Tesseract è più preciso ma non ha alcuna GUI.

La mia domanda è: esiste un programma OCR gratuito per Windows che ha una buona interfaccia grafica e un basso tasso di errore? Voglio che evidenzi le parole sospette (per incertezza OCR, non solo il controllo ortografico) e mostri la parola originale (bitmap) mentre sto modificando la parola OCR in modo simile a quello che fa SimpleOCR.

L'open-source sarebbe il migliore, seguito dal freeware, quindi prova / demo / crippleware molto indietro.

Schermata SimpleOCR che mostra la GUI per la correzione degli errori


possibile duplicato del software OCR gratuito
Sathyajith Bhat

2
@Sathya: i miei requisiti specifici lo differenziano da quella domanda.
Hugh Allen,

Non esattamente gratuito, ma hai guardato in Microsoft Office? Viene fornito con OCR. (Cercare la funzionalità "Document Imaging di Microsoft Office"
nell'installazione

@horsedrowner: l'ho appena provato. La sua precisione è paragonabile a Tesseract ma richiede un file TIFF con le impostazioni DPI appropriate o non funziona e non ha un'interfaccia per correggere gli errori OCR.
Hugh Allen,

@Hugh Allen: vero? Ha funzionato abbastanza bene quando mi sono imbattuto nella funzione del menu di scelta rapida in OneNote 2007. E stavo usando un file di immagine casuale copiato e incollato da un sito Web ...
Vivelin

Risposte:


2

Hai provato Gimagereader , un fronte gui per Tesseract?


L'ho appena provato (sotto Windows) e non funziona per me - il processo termina immediatamente senza un messaggio di errore :( Comunque guardando le schermate non sembra evidenziare effettivamente la parola che stai modificando. Hai provato vero?
Hugh Allen,

2

OCRopus :

Il software si basa in parte su Tesseract, il miglior motore OCR open source disponibile per ora. Mentre il progetto dovrebbe essere rilasciato alla fine del prossimo anno e verrà utilizzato per il progetto di scansione dei libri di Google, il team ha in mente alcune interessanti applicazioni:

  • un'interfaccia del servizio web
  • PDF, videocamera e schermo OCR
  • integrazione con strumenti di ricerca desktop: Beagle, Spotlight, Google Desktop

OCRopus (tm) è un sistema di analisi dei documenti e OCR all'avanguardia, con analisi del layout innestabile, riconoscimento dei caratteri innestabili, modellistica statistica del linguaggio naturale e capacità multilingue.

Il motore OCRopus si basa su due progetti di ricerca: un riconoscimento della calligrafia ad alte prestazioni sviluppato a metà degli anni '90 e distribuito dall'Ufficio censimento degli Stati Uniti e nuovi metodi di analisi del layout ad alte prestazioni.

Lo sviluppo di OCRopus è sponsorizzato da Google ed è inizialmente destinato a sforzi di conversione di documenti ad alto rendimento e ad alto volume. Prevediamo che sarà anche un eccellente sistema OCR per molte altre applicazioni. testo alternativo link:


GOCR

GOCR è un programma OCR (Optical Character Recognition), sviluppato sotto licenza GNU Public License. Converte le immagini scansionate del testo in file di testo. Joerg Schulenburg ha avviato il programma e ora guida un team di sviluppatori. GOCR può essere utilizzato con diversi front-end, il che rende molto facile il porting su diversi sistemi operativi e architetture. Può aprire molti formati di immagine diversi e la sua qualità è migliorata quotidianamente. testo alternativo testo alternativo

link:



Uno di questi ha una buona interfaccia grafica per andare con loro?
Hugh Allen,

1
A cura di rispondere alla tua domanda .... ma direi: "No, non lo fanno", ma sento che abiword supporta OCRopus ( arstechnica.com/open-source/news/2007/08/… )
Krazy_Kaos

1
+1 per l'aggiunta di schermate per rispondere e anche per la mini revisione dei due programmi offerti ...
Kurt Pfeifle,

0

Esiste anche TOPOCR (alias SnapReader), contenente il correttore ortografico post-elaborazione per 11 lingue:

SnapReader può essere utilizzato per creare le tue note ricercabili da quasi tutte le immagini del documento. Oppure puoi usarlo come strumento di creazione e creare il tuo contenuto modificabile usando lo scanner o la fotocamera e salvare i risultati come HTML o PDF. SnapReader può anche trasformare il testo in audio di altissima qualità usando Audrey. Quindi non solo puoi utilizzare lo scanner o la fotocamera per acquisire documenti, ma ora puoi anche utilizzare il tuo lettore musicale portatile o lo smartphone per "leggerli".

Immagine

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.