Come convertire un file .pdf in una cartella di immagini?


16

Ho alcuni file .pdf che vorrei convertire nel mio formato di lettura preferito di .cbr o .cbz o, se ciò non è direttamente possibile, ho bisogno di estrarre tutte le pagine dal .pdf come immagini e poi comprimerle il mio formato preferito. Sono stato in grado di salvare le pagine una alla volta con Document Viewer. Ovviamente, vorrei farlo un po 'più veloce. Ho provato pdfsam, pdf shuffler e pdfmod tutti senza fortuna. Sto usando Ubuntu 11.10.

Risposte:


14

OK, ho fatto qualche ricerca in più e sebbene il metodo di tohuwawohu funzioni, ho trovato più facile usare un programma chiamato pdftoppm per ottenere ciò che volevo fare. Dal momento che sono praticamente un laico quando si tratta di utilizzare le app della riga di comando, farò del mio meglio per spiegare come ho fatto a farlo funzionare per me.

  1. Passare alla cartella contenente il .pdf che si desidera modificare e aprire un terminale lì. L'ho fatto usando il comando di esempio:

    cd ~/Documents/PDF
    
  2. Diciamo che il file che voglio modificare si chiama Sample.pdf Quello che voglio fare è usare pdftoppm per creare file di immagine di ogni pagina del .pdf. È possibile scegliere diversi formati (vedere il link alle pagine man sopra) ma preferisco usare .png. Il comando di base è simile al seguente:

    pdftoppm -FORMAT FILENAME.pdf PREFIX
    

    o nell'esempio sopra:

    pdftoppm -png Sample.pdf Sample
    

    Questo comando crea un file immagine di ogni pagina nella stessa cartella del file .pdf originale con nomi come Sample-01.png, Sample-02.png e così via. L'ho provato con successo con le estensioni .png e .jpeg. .jpg apparentemente non è supportato.

  3. Quindi uso Archive Manager selezionando tutti i file di immagine appena creati, facendo clic con il tasto destro del mouse e selezionando "Comprimi" dal menu di scelta rapida. Scelgo quindi il formato di archivio che preferisco (in questo caso .cbz o Comic Book Zip) e creo il nuovo archivio.

  4. Ora ho un nuovo brillante file .cbz chiamato Sample.cbz che posso quindi visualizzare con il mio lettore Comix !

Spero che ciò che ho pubblicato sopra abbia abbastanza senso che qualcun altro possa imparare da esso. Se devo cambiarlo in qualche modo, per favore fatemelo sapere.


Molto bella! Sembra che pdftoppmsia in effetti più facile da usare rispetto a ImageMagick convert.
tohuwawohu,

sì, è molto utile e facile. Voglio solo sapere. può aggiungere il prefisso alfa. Come prefisso-a, prefisso-b, prefisso-c, in questo modo
Pankaj Badukale,

pdftoppmè estremamente lento e utilizza tutta la RAM sul mio computer. pdfimages -jha funzionato molto meglio.
Eric Duminil,

4

Non ho molta familiarità con * .cbr / * .cbz, ma sembra che dovrai combinare due passaggi:

  1. Converti PDF in immagini
  2. Comprimili in un archivio ZIP / RAR.

Per quanto riguarda il passaggio 1, è possibile utilizzare il comando di ImageMagickconvert . È possibile alimentare convertcon un PDf composto da più pagine e convertrestituirà ciascuna pagina come singolo file grafico. L'ho testato con un testo scansionato a 400 dpi e il seguente comando ha dato come risultato singoli JPGE piacevoli:

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpeg

(crediti relativi -qualityall'opzione: questa voce nel forum )

Di conseguenza, si ottiene 000.jpeg, 001.jpege così via. Basta comprimerli in un .cbzfile e il gioco è fatto.

Puoi anche combinare entrambi i passaggi "concatenandoli":

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpg && zip -vm comic.cbz *.jpg

(assicurati che non ci siano altri JPEG nella tua attuale directory di lavoro, poiché usando il codice sopra, zip sposta tutti i JPEG nel file cbz)


4

Ho scritto un semplice script bash esattamente per questo scopo, avrai bisogno di poppler installato, quindi:

sudo apt-get install poppler-utils #ubuntu
brew install poppler # mac

Ecco lo script bash (salvalo come convert_to_cbz.sh):

filename="${1%.*}"
echo "Converting $filename to cbz"
mkdir "./$filename"
pdftoppm -jpeg "$1" "./$filename/000"
zip -r9 "${filename}.cbz" "./$filename" 
rm -rf "./$filename"

Per usare lo script bash:

chmod +x convert_to_cbz.sh
./convert_to_cbz.sh "Nintendo Official Magazine 066 (OldGameMags).pdf"

Spero che questo sia utile per qualcuno!


Magnifico, grazie. Ho dovuto cambiare un po 'la sceneggiatura però. pdftoppmha usato tutta la mia RAM e si è bloccato il mio computer. Sostituire la 4a riga con ha pdfimages -j "$1" "./$filename/000" fatto il trucco. Funziona bene, è veloce, non sembra esserci alcuna perdita di qualità e il cbz è leggermente più piccolo del pdf originale. pdfimagesè anche incluso in poppler-utils.
Eric Duminil,

3

Prova a usare calibre per convertire direttamente il .pdf in .cbr o .cbz.


Grazie per il suggerimento, ma per me usare Calibre come soluzione non funzionerà. Ho installato il programma e mi dispiace dire che sporge come un pollice dolente sul mio desktop! Inoltre, ho scoperto che usando il comando pdftoppm di seguito è molto più veloce dell'installazione e della configurazione di Calibre prima della conversione.
Shawn,

@Shawn Sì, direi che Calibre è brutto e lento, ma fa il suo lavoro. Sono contento che tu abbia trovato una soluzione migliore, però :)
bntser

1

Sembra che il modo più semplice sia usare Acrobat Pro.

  1. Apri il PDf in Acrobat Pro.
  2. Una volta aperto il file, vai a FileExportImageJPEG, esporterà ogni pagina come un singolo JPG.
  3. Metti tutti i JPG in una cartella
  4. Comprimi la cartella.
  5. Modifica manualmente l'estensione alla fine del file zippato da .zip a .cbz

Se si preferisce un file CBR , raramente la cartella anziché comprimerla, quindi modificare l'estensione da .rar a .cbr .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.