Convertitore da PDF a testo [chiuso]


9

Sto cercando un modo "one-click" per prendere QUALSIASI PDF e convertirlo in testo semplice. Idealmente su OSX o Linux.

Idealmente, la soluzione dovrebbe includere la funzionalità OCR, ma non necessariamente.

La massima priorità è avere qualcosa che può prendere QUALSIASI file SENZA configurazione.

Risposte:


23

C'è xpdf che include il pdftotextbinario.

Pdftotext converte i file Portable Document Format (PDF) in testo semplice.

Su Linux è disponibile un programma di installazione. Sembra che arrivi anche nel poppler-utilspacchetto. Su OS X è possibile installarlo utilizzando Homebrew (installarlo prima) e quindi utilizzare

brew install homebrew/x11/xpdf

che scaricherà i file sorgente e lo compilerà per OS X. Successivamente, usalo come:

pdftotext your_pdf_file.pdf

che genererà un file di testo semplice. Ci sono anche un paio di opzioni, controlla man pdftotextper maggiori dettagli.

Un'alternativa è poppler , in OSX:

brew install poppler

in Debian e amici

apt-get install poppler-utils

ad oggi il comando èbrew install homebrew/x11/xpdf
Diego Vieira,

1
@DiegoVieira Grazie. La prossima volta sentiti libero di suggerire una modifica!
slhck,

qualche vantaggio usando poppler invece di xpdf / pdftotext?
Gonzalo Bahamondez,

brew install Caskroom/cask/pdftotext
Hugo,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.