13
elaborazione delle immagini per migliorare la precisione dell'OCR tesseract
Ho usato tesseract per convertire documenti in testo. La qualità dei documenti varia enormemente e sto cercando consigli su quale tipo di elaborazione delle immagini potrebbe migliorare i risultati. Ho notato che il testo altamente pixellato - ad esempio quello generato dai fax - è particolarmente difficile da elaborare per …