Come posso ottenere lo screenshot della migliore qualità per OCR (Optical Character Recognition)?


2

Sto cercando di ottenere alcuni dati in un file di testo dagli screenshot. Apparentemente gli screenshot non funzionano molto bene con l'OCR perché sono 75 dpi e il minimo per OCR di buona qualità è 150 dpi. Qualcuno sa un buon modo per fare screenshot per l'OCR?

In questo momento sto ottenendo risultati abbastanza buoni con gli strumenti online gratuiti come new-ocr ma fa errori che devo correggere ogni tanto. Quindi mi piacerebbe qualche consiglio.  Ho anche testato lo screenshot di ABBYY ed è stato piuttosto brutto ... gli strumenti online sono migliori.


Sto usando ABBYY screenshot reader, e funziona perfettamente bene per me. L'ho appena testato di nuovo sulla tua stessa domanda. Mi chiedo se i tuoi compiti siano particolarmente difficili per qualche motivo.
texnic

Risposte:


1

A partire dal 21 giugno 2011 puoi utilizzare Google Documenti per gli screenshot di OCR in un batch.

Puoi caricare una cartella di immagini e convertirle in Documenti, che conterrà sia l'immagine che il testo OCR.

È quindi possibile scaricare in batch tutti questi documenti come testo normale, eliminando l'immagine.

Se i tuoi screenshot hanno nomi di file univoci, dovrebbe essere banale collegarli con il testo OCR in praticamente tutti i sistemi.


4

Recentemente ho avuto una necessità simile (non per uno screenshot ma per una pagina fax). Ocrterminal.com ha fatto un ottimo lavoro, è veloce e gratuito per un certo numero di conversioni al mese (penso a 20?). Un amico usa Tesseract , che è basato sulla riga di comando e sembra funzionare bene pure.


Stavo usando newocr.com, che è anche veloce e gratuito. Ha funzionato bene, ma ho dovuto correggere molti errori. Oh bene, non posso essere avido, la cosa è in realtà scattare foto e trasformarlo in testo hehe ...
GiH

1

ScreenOCR (21 giorni di prova) dichiara di fare un buon lavoro con gli screenshot (che ti aiuta a fare). Non l'ho provato però.


0

Suppongo che, poiché le schermate utilizzano un font anziché la scrittura a mano che le esegue a 75 dpi, non sarebbe poi così male.


a volte verrai sorpreso, non è affatto coerente
GiH

0

Io uso Greenshot per i tappi dello schermo


1
parlando di OCR ...
GiH

Sì, non ero sicuro perché la seconda parte della domanda era un po 'ambigua;) grazie per averlo aggiornato per chiarire.
Shevek
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.