Su Linux - Come estrarre il testo da un testo .pdfin cui il testo è veramente testo, non un'immagine acquisita? Voglio qualcosa che posso usare dalla riga di comando / in uno script, non in modo interattivo. (Non voglio convertirmi in .tife utilizzare OCR - il testo è già disponibile nel .pdffile, quindi perché introdurre inesattezze da OCR imperfetto?)