Come posso salvare un file PDF di immagine come immagine?


33

Ho un PDF che contiene un'immagine di scansione di un documento. Voglio salvare il contenuto di questo PDF come immagine in modo da poterlo eseguire attraverso un programma OCR che accetta solo file di tipo .jpg, .png e .gif.

Come posso salvare / convertire questo PDF in uno di quei formati di immagine?

EDIT: Un modo che ho trovato per fare questo è quello di fare clic su ogni pagina. Copia negli appunti. Incolla su Paint.net e poi salva. Tuttavia, ciò risulta ingombrante poiché sembra che sia possibile selezionare una sola pagina alla volta in Acrobat Reader.

Risposte:


20

Per favore, presta molta attenzione alla risposta di Pooryorick , in cui sottolinea come la risposta di Sleske sia in realtà una risposta molto migliore per questo particolare problema.


Usa GhostScript . Questo comando funziona per me:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

Esistono più pseudo-dispositivi png, che si differenziano per l'intensità del colore: pngmono, pnggray, png16, png256, png16m e pngalpha. Scegli quello che preferisci.

Puoi anche usare jpeg, ma a meno che tu non abbia un problema di spazio su disco, desideri una qualità elevata quanto puoi gestire per il tuo OCR, e questo non è jpeg.

GhostScript non ha più supporto per gif, ma non riesco a immaginare perché ne avresti bisogno, e con il supporto di png256.


Adoro GhostScript e se desideri la comodità di una GUI per l'impostazione delle opzioni, la visualizzazione, ecc. Prova GSview pages.cs.wisc.edu/~ghost/gsview
Dennis

L'output sarà un'immagine enorme?
Xonatron,

1
@Xonatron: No. Un'immagine per pagina. Il %dnome del file di output è una variabile che viene sostituita con il numero di pagina. (Quasi certamente numeri grezzi, non il numero all'interno del PDF.)
wfaulk,

20

Installa Imagemagick . Apri una finestra o un terminale cmd:

convert myfile.pdf myfile.jpg

L'output sarà 1 file jpg per ogni pagina nel tuo pdf, test-0.jpg, test-1.jpg, ecc.


+1 per ImageMagick, ma -2 per averlo suggerito per un lavoro sbagliato. JPEG è buono per le foto, ma è il formato peggiore da utilizzare quando si hanno egde nitide e contrasti elevati (come in genere con testo / caratteri neri su sfondo bianco). Inoltre, ImageMagick non esegue il lavoro di conversione in sé, ma utilizza Ghostscript in background come slave "delegato". Quindi farlo con Ghostscript ti dà direttamente più controllo sui parametri utilizzati. E quindi scegli TIFF (non JPEG) come formato di output, per l'amor di Dio!
Kurt Pfeifle,

1
Nota su Windows, assicurati di installare prima Ghostscript a 32 bit.
Utente

2
Essere consapevoli del density, depthe qualityle bandiere che possono aiutare a ottimizzare l'output. Ad esempio: convert -density 300 -depth 8 -quality 85 a.pdf a.png Ulteriori informazioni
Nick,

13

C'è anche pdfimagesdagli strumenti Xpdf (disponibili dal sito di XpdfReader ). Non converte un'intera pagina PDF in un'immagine, ma estrae immagini incorporate da un PDF.

Ciò è utile se il PDF contiene testo e immagini e si desidera solo le immagini. Inoltre, estrarrà le immagini nel loro formato originale, quindi non è coinvolta alcuna perdita di qualità (a differenza dei programmi che rendono l'intera pagina e la convertono ad esempio in JPEG). A seconda delle esigenze potrebbe essere utile.


Semplice utilizzo:

pdfimages -j -list mydocument.pdf mydocument-images

Questo leggerà il file di input mydocument.pdf, estrarrà tutte le immagini e le scriverà nei singoli file denominati mydocument-images-0000.jpg, mydocument-images-0001.jpgecc.

L'opzione -jconsente di scrivere immagini compresse JPEG incorporate come file JPEG, non come file PBM / PGM / PPM (che sono non compressi ed enormi). Si noti che le immagini possono ancora essere scritte come file PBM / PGM / PPM, se è così che sono state memorizzate nel file di input PDF.


Per riferimento, l' uso semplice è pdfimages -j "yourinputfile.pdf" "outputimages"che renderà "outputimages-0000.ppm" (o "outputimages-0000.jpg" se sono nel formato giusto). Esempi di .NET possono essere innestati da qui o qui
drzaus,

Un avvertimento è che potrebbe non essere in grado di salvare il file come JPG, ma piuttosto un PPM
drzaus,

11

Puoi farlo usando Adobe Reader:

  1. Clicca l'immagine. Sarà evidenziato.
  2. Copia (Ctrl-C) e incollalo in Paint.
  3. Salva come qualsiasi tipo di file che ti piace.

2
interessante da sapere, Adobe Reader ha un'impostazione per sovrascrivere i dpi delle immagini scattate con lo strumento Istantanea, quando impostato su 300 dpi, otterrai istantanee pronte per la stampa (per impostazione predefinita la risoluzione dello schermo è presa, che generalmente è troppo bassa da riutilizzare in altri lavori)
Stijn Sanders,

3
+1 per semplicità. La maggior parte dei lettori PDF ti consente di farlo.
Decio Lira,

4
Cosa succede se il tuo PDF ha 10000 pagine di immagini? Devi farlo 10000 volte?
Guy

9

Ad eccezione della risposta che menziona pdfimages, tutte le altre risposte non menzionano che le loro soluzioni in realtà transcodificano le immagini incorporate. Cioè, quelle soluzioni non estraggono semplicemente l'immagine originale, ma la modificano, eventualmente a scapito dell'immagine, durante il processo. Solo pdfimages estrae l'immagine originale. Questo vale per Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview e la maggior parte degli altri software PDF.


Dato il contesto della domanda, questo è in realtà un ottimo punto.
wfaulk,

FWIW, "PDFill PDF Tools" ti consente di impostare il DPI per il salvataggio come immagine, molto utile. Pertanto ogni pagina (a partire da testo, immagini, qualunque oggetto) viene salvata, ad esempio, in un PNG ad alta risoluzione a 4961x6520.
Chris O,

4

PDFill PDF Tools è probabilmente il modo più semplice per convertire i tuoi PDF in immagini su Windows. Ti consentirà di esportare tutte le pagine del PDF per separare le immagini in un colpo solo. Ha anche molte altre funzioni disponibili gratuitamente, che sono disponibili solo in altri visualizzatori di PDF se acquisti la versione commerciale o "Pro".

Utilizzare il pulsante "Converti PDF in immagini" (pulsante n. 10) nello screenshot seguente.

Schermata PDFill PDF Tools

Se è necessario concatenare le immagini in un'immagine molto alta in modo da alimentare un solo file nel programma OCR, è possibile utilizzare IrfanView


nota che questo installerà due diversi strumenti sul tuo sistema. Il principale è PDFill Editor, che è quello che non ti serve. Vai nel menu di avvio per aprire questo. Sono stato salvato dallo screenshot rendendomi conto che qualcosa non andava prima di disinstallarlo.
ufotds

Sì, immagino di non aver menzionato il fatto che installa anche una versione shareware di PDFill Editor e una stampante PDF. Tutti i file creati con PDFill Editor avranno una filigrana a meno che non si acquisti l'editor per $ 19,99, ma l'utilità PDFill PDF Tools Free non richiede alcun acquisto. Nella versione che ho, non è possibile disinstallare PDFill Editor senza disinstallare PDFill PDF Tools gratuitamente, ma avere PDFill Editor installato non danneggia nulla.
rapina

2

Poiché non hai incluso un tag OS, includerò una risposta OSX:

I PDF per impostazione predefinita si aprono in Preview.app che consente di utilizzare File -> Save-As:

  • GIF
  • ICNS
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • Photoshop
  • PNG
  • TGA
  • TIFF

1

Anche PDF Xchange Viewer (gratuito) eseguirà l'esportazione in file. File → Esporta → Esporta in immagine.

Non solo, ma penso che sia il miglior visualizzatore di PDF gratuito per Windows e abbia alcune buone funzionalità di markup. Ho una licenza per Adobe Acrobat e lo preferisco ancora, a meno che non stia eseguendo modifiche estese, il che è raro.


Sembrava promettente, fino a quando ho scoperto che l'opzione per esportare in immagine è disabilitata per PDF protetti da password.
Mitch,

1

(Non libero) Acrobat Professional fa questo:

Avanzate-> Elaborazione documento-> Esporta tutte le immagini ...


0

Se il file è inferiore a 5 MB e non sei preoccupato per la privacy / la riservatezza, allora è un utile servizio online su http://www.go2convert.com/ che può fare molte conversioni grafiche (incluso pdf in jpeg)


Ho appena provato e ha visualizzato questo messaggio di errore "Siamo spiacenti! Impossibile convertire correttamente questa immagine."
Guy

-1

Se l'immagine supera le dimensioni dello schermo, è possibile utilizzare FastStone Capture (la funzione "Capture Scrolling Window") e salvare l'immagine come JPEG.

testo alternativo


È un modo molto indiretto per catturare un'immagine. OP ha già una soluzione migliore (contrassegnare la pagina in Acrobat).
sleske,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.