Abbyy lettore eccellente come applicazione per Ubuntu 13.04


5

Ho molte immagini e quello che voglio fare è scansionare quelle immagini e ottenere l'output in un file di parole ms che può essere modificato in seguito. Per Windows, ho Abbyy fine reader. Ma non voglio tornare a Windows. Per favore dimmi se c'è qualche applicazione che può fare lo stesso per me. Per favore, aiutatemi in questo.

Risposte:


1

Puoi usare Abbyy OCR.

ABBYY FineReader Engine CLI per Linux è uno strumento CLI pronto all'uso basato sulle tecnologie avanzate di riconoscimento ottico dei caratteri (OCR) di ABBYY. Lo strumento automatizza l'OCR e la conversione dei documenti su sistemi Linux.

Per ulteriori informazioni e per scaricarlo, visitare il sito Web .

Fonte: Ocr4Linux


1

Prima di tutto, ecco alcuni altri strumenti OCR oltre ad Abbyy che hanno un SDK e che puoi usare su Linux. Ma nota che non tutti supportano l'output di MS Word:

  • Tesseract: solo output di testo
  • Ocrad: solo output di testo
  • GOCR - solo output di testo
  • CuneiForm - Uscita RTF
  • OmniPage - Documenti Google e output PDF

Ecco un articolo (del 2007, ma probabilmente ancora rilevante) che mette a confronto i primi tre motori in termini di precisione e velocità: http://www.mathstat.dal.ca/~selinger/ocr-test/

A proposito, tutti i motori incluso Abbyy sono i migliori per il testo non strutturato - in altre parole, le immagini che non seguono una struttura regolare. Se le "immagini" che stai elaborando hanno un layout standard, ad esempio moduli compilati dai clienti (dove i campi sono sempre nello stesso posto), varie carte (come biglietti da visita, carte d'identità), ecc., Ci sono soluzioni specializzate che è in grado di rilevare e OCR solo i campi di testo specifici, "ripulire" il "rumore" dell'immagine e produrre il testo in modo strutturato (ad esempio Nome = John Smith, Numero ID = 123456).

Se le tue immagini SONO "modelli" e hai bisogno di un OCR in grado di produrre testo strutturato, in realtà ci sono pochissime soluzioni Linux (per quanto ne so). Ecco due soluzioni con cui ho familiarità:

  • CSSN OCR ( http://www.card-reader.com ). È specializzato in documenti di tipo carta come carte d'identità, patenti di guida, carte mediche, assegni bancari, carte di credito, ecc. Funziona su Linux usando WINE.
  • ARH ( http://www.arhungary.hu ). In grado di leggere documenti di viaggio, passaporti, visti e carte d'identità.

HTH, Dana

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.