Crea pdf dal libro HTML


16

Ci sono alcuni siti che forniscono libri come pagine HTML (ad esempio, materiale legale).

Cosa posso usare per creare un libro PDF da queste pagine, basato sulla struttura già esistente?

In Windows c'è Adobe Professional (software commerciale). Immagino che Linux abbia qualcosa di gratuito? Una soluzione che coinvolga lo scripting sarebbe OK per me.

Risposte:


9

Calibre è uno strumento abbastanza potente per convertire oggetti in ebook in vari formati. Disponibile in un centro software vicino a te!

Non lasciarti ingannare dalla sua interfaccia utente meno che bella, può fare molto.


1
calibre include anche uno strumento da riga di comando, ebook-convert. Quindi con ciò potresti fare for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; donee convertiresti tutti i file html nella cartella in PDF.
frabjous

1
Questo è un buon strumento, sono anche un utente Calibre, penso che l'ultimo abbia segnato miglioramenti nell'interfaccia utente.
Sabacon,

4

La via più facile? File> Stampa dal tuo browser. Seleziona Stampa su file come stampante e ti chiederà dove lo desideri. Assicurati di contrassegnare il PDF. Premi "Stampa" e sarà effettivamente salvato sul tuo disco invece che effettivamente stampa.


Grazie. Ci sono molti file, però. Questa manovra è praticamente impossibile.
Lucian Sasu,

4

Htmldoc può essere utile, vederlo qui; http://www.htmldoc.org/ è disponibile presso il software center, purtroppo la versione 1.8 ha un problema con i file con codifica Unicode ma in molte occasioni può ancora essere un salvatore, il problema è stato risolto nella versione di sviluppo 1.9.

Di solito uso la meravigliosa estensione per album qui; http://amb.vis.ne.jp/mozilla/scrapbook/ per Firefox per acquisire le pagine Web, utilizzare gli strumenti di modifica in scrapbook per correggerli se necessario e quindi utilizzare htmldoc per convertire tutte le pagine in PDF.



3

Consiglierei di usare OpenOffice / LibreOffice per creare il PDF. Come test ho scaricato il manul di Wget (tutto in una pagina), quindi ho aperto la pagina HTML in OponOffice e ho fatto clic sul pulsante "Esporta direttamente in PDF". Ha creato il PDF con un indice dal sommario.

In passato ho scoperto che questo è il modo più semplice per convertire pagine HTML in PDF. Ti consente anche di apportare modifiche senza troppi sforzi.

Screenshots:

  • Manuale di Wget esportato in PDF utilizzando Open Office Manuale di Wget esportato in PDF utilizzando Open Office

  • Esporta direttamente in PDF opzione in Open Office Esporta direttamente in PDF opzione in Open Office


qualche idea se il libro non è in una pagina, ma suddiviso in più capitoli / sezioni?
Ciprian Tomoiagă,

2

In realtà ho votato per la soluzione di calibro. Ma eccone un altro che potresti provare. Installa AbiWord . Può fare conversioni tra tutti i formati che conosce dalla riga di comando. Per convertire tutti i file .html in una cartella in .pdf puoi fare:

for file in *.html ; do abiword --to=pdf "$file" ; done

Per tipografia di livello superiore (ma probabilmente più complicata), un'altra opzione sarebbe PrinceXML .


2

A seconda del documento html da stampare, potresti ottenere i migliori risultati usando pandoc . Questo è uno dei convertitori da HTML a LaTeX più versatili. Il file .tex risultante può essere convertito in PDF abbastanza facilmente, usando xelatexo pdflatex. Molte opzioni sono disponibili se si desidera approfondire la sintassi e i pacchetti LaTeX. Questo potrebbe non funzionare bene se si dovrebbero conservare immagini incorporate e stili HTML sofisticati.


1

In google-chrome, puoi creare un file pdf per un intero sito usando un'estensione. Personalmente uso l' estensione del convertitore Web2PDF che crea un PDF con un clic.

Ecco uno screenshot di questo plugin, fornito dal sito del negozio Web di estensioni di Google.

inserisci qui la descrizione dell'immagine

Inoltre, puoi vedere un PDF creato da me con questo strumento, scaricando il successivo (tasto destro, salva oggetto con nome): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (alcuni browser come google- Chrome potrebbe consentirti di vederlo online).

E se desideri modificare quei PDF creati dall'estensione per rimuovere la firma digitale posizionata dall'estensione nella parte inferiore di ogni pagina o per rimuovere qualsiasi altra cosa, dai un'occhiata a questo: Rimuovere le informazioni di testo da un PDF?

In bocca al lupo!

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.