Estrazione di immagini incorporate da un PDF


165

Prima di iniziare a utilizzare Ubuntu ho usato il lettore PDF Nitro per estrarre automaticamente le immagini dai file PDF. Esiste un lettore PDF per Linux che lo fa?

Mi piacerebbe essere in grado di estrarre le immagini più velocemente / più facilmente rispetto a quando si scatta una fotografia.


Riesci a ricordare quanto bene NitroPDF può fare con le immagini vettoriali? Può pdfimagesfarlo meglio / peggio di NitroPDF?
Léo Léopold Hertz

2
Possibile duplicato dello strumento da riga
funky-future

2
@ funky-future Chiaramente le due domande sono duplicate ma il tuo obiettivo duplicato ha solo due risposte e una di queste due risposte è una risposta spam, quindi la direzione della duplicazione dovrebbe essere invertita per salvare questa domanda dall'essere martellato dal martello dupe.
karel,

Risposte:


197

Uso pdfimages

pdfimages è uno strumento di estrazione di immagini PDF che salva le immagini in un file PDF in formato PPM, PBM, JPEG o JPEG 2000.

Fa parte del poppler-utilspacchetto, che dovrai installare.

Uso: pdfimages [options] <PDF-file> <image-root>

Esempio: Di seguito vengono estratte tutte le immagini da un file PDF, salvandole in formato JPEG.

pdfimages -j in.pdf /tmp/out

Salverà le immagini dal file PDF in.pdfin file /tmp/out-000.jpg(o /tmp/out-000.pbm; vedi sotto) /tmp/out-001.jpg, ecc.


La pagina man di pdfimages spiega:

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.

8
Sarebbe bello avere una soluzione che estrae le immagini nel suo formato nativo. La ricodifica dei JPEG non è proprio l'ideale.
Christian

32
@Christian dalla pagina man-all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
wil93

2
Si noti che lo -allswitch è supportato solo nelle recenti revisioni poppler-utils. Ad esempio, se sei ancora al 12.04 non sarai in grado di accedere a questa opzione
Glutanimate,

1
Se non è possibile utilizzare, -allandare per i formati PNM. Sono senza perdita di dati e puoi postelaborare le immagini, ad es. In PNG.
Tomasz Gandor,

1
@Christian, usa $ pdfimages -list <PDF-file>per controllare il formato originale nella colonna "enc", quindi non devi ricodificare l'immagine in un altro formato.
Jose Barakat,

24

Uso spesso Inkscape per questo. Carica la pagina ed elimina tutte le altre cose. Il vantaggio è che puoi ottenere immagini vettoriali in SVG e modificarle come preferisci.


Alcuni PDF possono essere importati correttamente solo con l'importazione interna di Inkscape (l'importazione poppler / cairo o pdfimage non possono analizzarli correttamente). Una volta importato, copia e incolla l'immagine in un nuovo file e ridimensiona la pagina in selezione graphicdesign.stackexchange.com/a/21638/95041
sdaffa23fdsf

Nessun problema per me, questa è stata la soluzione migliore, nota che devi scegliere una pagina alla volta!
Jimmy Olano,

5

Ho un file PDF a doppia colonna con immagini incorporate create con LaTeX in cui le immagini originali sono state fornite come EPS. Ho provato la soluzione proposta in base pdfimages, ma sfortunatamente, non ha restituito alcuna immagine. Ho provato quindi a utilizzare Inkscape, ma le immagini SVG che ha generato erano distorte e non ho avuto fortuna ad esportarle come EPS.

Il software che ha funzionato per noi era MasterPdfEditor .

Ecco la procedura

  • Apri il tuo file utilizzando Master PDF Editor
  • Usa lo strumento di modifica (Alt + 1) per selezionare l'immagine che devi estrarre
  • Copia la figura (Ctrl + C)
  • Fai clic sulla cornice tratteggiata circostante intorno all'immagine e controlla la barra laterale destra (Ispettore oggetti) e fai clic su "Geomerty". Lì puoi vedere la dimensione della tua selezione
  • Crea un nuovo file (Ctrl + N). Ti verrà richiesto di fornire le dimensioni della pagina. Fornisci la dimensione esatta dell'immagine e crea il nuovo file
  • Ora è un po 'complicato: incolla l'immagine (Ctrl + V). L'immagine potrebbe non essere visualizzata nel nuovo file. Utilizzare le frecce per spostarlo fino a quando non si è in grado di rintracciarlo.
  • Utilizzare le frecce per centrare l'immagine nella nuova pagina
  • Salva come PDF

Il risultato è di altissima qualità, ma il software non è gratuito. Esiste una versione demo che "ti consente di provare tutte le funzionalità", ma include "l'aggiunta di una filigrana sul file di output". Ad essere sinceri, non ho notato alcuna filigrana nel PDF prodotto.


Questo è Chiedi a Ubuntu ... Ci piace l'open source qui e la tua soluzione è una soluzione commerciale a codice chiuso ... Come va meglio delle risposte già votate? (-1 nel frattempo)
Fabby

3
@Fabby Grazie per il feedback. Non lo sapevo. Esiste una regola del genere su askubuntu.com? Tuttavia, non appena si apre il centro software Ubuntu , si ottengono suggerimenti per applicazioni non libere.
Pantelis Sopasakis,

No, non esiste una "regola" ed è per questo che non ho votato per eliminare questa risposta, ma ci sono strumenti migliori che sono gratuiti (come nella birra gratuita e nella libertà di parola), quindi questa è solo un'opinione.
Fabby,

1
+1. Ho usato la riga di comando di ImageMagick, ma questa è una soluzione interessante per chi cerca una GUI.
rpmcruz,

2
Funziona per alcune persone, va bene. Non essere un nazista .... Non so chi siamo. Puoi parlare solo per te stesso. +1 per la risposta
sdaffa23fdsf,

4

Puoi anche provare pdfmod. È una GUI (interfaccia grafica) che può estrarre immagini e fare altre manipolazioni di base in pdf.


Hmm, mi sembra un po 'difettoso. Inserito un PDF con immagini prevalentemente viola e immagini verdastre.
DBX12,

2

Se hai bisogno di un'immagine ritagliata in formato pdf / eps, estrai una pagina con l'immagine usando pdfmod(come suggerito da fare).

Quindi l'utilizzo pdfcroppotrebbe ritagliarlo correttamente impostando i margini per tentativi ed errori:

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf

1

Uso pdfimages che è uno strumento da riga di comando e funziona benissimo per me. È molto facile da usare e puoi usare l'opzione --help per saperne di più sul suo utilizzo. Uso Ubuntu e viene preinstallato. Se i tuoi file pdf sono crittografati o protetti da password ci sono opzioni per questo, quindi questo strumento funziona alla grande. Puoi leggere di più su pdfimages qui


4
Leggi le altre risposte prima di pubblicare le tue. Si noti che ce n'è un altro che copre questo.
edwin,

Ok, scusa :) Ho pensato di pubblicare il mio perché ha alcune informazioni sui file pdf protetti da password e spiego che questo strumento ha queste opzioni, inoltre ho pubblicato un link che è un tutorial su questo strumento.
jetbird13

Se guadagni abbastanza reputazione, puoi commentare le risposte degli altri o votarle.
edwin,

1

Con pdfimages l'immagine estratta può essere in due o più parti. Un modo semplice per rimetterli insieme senza preoccupazioni per i formati estratti è importare le parti in LibreOffice Draw, ritagliare con il dialogo di ritaglio dell'immagine, posizionare le parti, regolare le dimensioni della pagina ed esportare in qualsiasi formato tu preferisca.


1

Se vuoi ritagliare un'immagine da un pdf con un pdfviewer, puoi provare okular. Può ritagliare qualsiasi cosa (testi o immagini) in formato png o jpeg. Se vuoi estrarre immagini in formato png da un pdf, puoi farlo con un comando minimo con pdftohtml. Converte pdf in html più immagini. Qui puoi trovare un esempio: https://www.youtube.com/watch?v=CG1rf7k3xo8 . Se vuoi estrarre molte immagini da un pdf, ti consiglio di provare questo.


0

Software utilizzato: sistema operativo Xreader: Antergos

passi:

  1. Apri PDF
  2. Fare clic con il tasto destro sull'immagine
  3. Seleziona Salva immagine come ..
  4. Immettere il nome e l'estensione del file.
  5. Salva.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.