Preferibile open source, ma non necessario.
Ho Adobe Acrobat 8 e mi piace molto la funzione OCR che può essenzialmente mettere un livello invisibile di testo OCR sopra un documento acquisito. Quindi quello che vedi sullo schermo è il documento scansionato originale, ma il risultato è ricercabile.
Quello che sto cercando è un modo per automatizzare questo processo. Al momento ho alcuni script che utilizziamo per elaborare e archiviare i file scansionati e sto cercando qualcosa che posso collegare direttamente a questo processo batch per eseguire l'OCR in un modo simile a quello che posso fare con Acrobat.
Tutti i suggerimenti sono benvenuti, grazie!