Ho visto alcuni e-book / documenti apparentemente scansionati dalle loro versioni cartacee, ma il testo negli e-book / documenti può essere incredibilmente copiato. Suppongo che le versioni a scansione diretta debbano essere state elaborate da alcuni software di riconoscimento ottico dei caratteri.
Quindi vorrei sapere quali sono i software di riconoscimento ottico dei caratteri consigliati? Soprattutto quelli che sono per Ubuntu o gratuiti? Se quelli per Windows sono molto più superiori, per favore fatemelo sapere pure.
Sono particolarmente interessato a quegli OCR che possono accettare un file pdf scansionato come input e comunque produrre come output un altro file pdf che assomiglia a quello di input ma con il suo testo copiabile.
Grazie e saluti!
Si prega di limitare un software per risposta