Su Linux - Come estrarre il testo da un testo .pdf
in cui il testo è veramente testo, non un'immagine acquisita? Voglio qualcosa che posso usare dalla riga di comando / in uno script, non in modo interattivo. (Non voglio convertirmi in .tif
e utilizzare OCR - il testo è già disponibile nel .pdf
file, quindi perché introdurre inesattezze da OCR imperfetto?)