Filtraggio di una sorta di immagine "semi-tonica" per l'elaborazione OCR


10

Ho un materiale PDF digitalizzato a cui voglio aggiungere un livello di testo nascosto, in modo da poter indicizzare il documento. Ho usato il dispositivo di output tiff in bianco e nero di ghostscript (tiffg4) per estrarre pagine come immagini tiff, ed ecco un esempio di come sono:

inserisci qui la descrizione dell'immagine

L'elaborazione di questa immagine con tesseract non fornisce buoni risultati.
La modifica dell'output di ghostscript DPI (600, 300, 150, 96) mostra che l'immagine a 96 DPI offre i migliori risultati da tesseract ma non è ancora soddisfacente.

Ora ho pensato di chiedere consiglio quale filtro avrebbe migliorato questa immagine per l'elaborazione OCR.

Potrei usare imagemagick, o numpy / scipy / ndimage

Risposte:



2

puoi rimuoverlo usando un filtro passa-basso. ciò viene fatto nello spazio delle frequenze o semplicemente prende la (differenza di) gaussiana dell'immagine.

passa basso gaussiano, quindi differenza di gaussiani da affinare

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.