Converti pagine Web in un file per ebook


23

Voglio scaricare HTML (esempio: http://www.brpreiss.com/books/opus6/ ) e unirmi a un HTML o ad un altro formato che posso usare sul lettore di ebook. I siti con libri gratuiti non hanno un paging standard, non sono blog o forum, quindi non sanno come eseguire la scansione e l'unione automatica.

Risposte:


13

Puoi utilizzare Calibre per le tue esigenze di conversione degli ebook. Puoi ottenerlo per creare un singolo ebook di più file HTML collegandoli a un singolo file HTML impostato come indice come questo .


Sto usando Sigil per la conversione in EPUB, ma non sapevo che Cailbre potesse creare un ebook da un gruppo di htmls collegati. Ci proverò, grazie!
Hrvoje Hudo,

1
È possibile utilizzare httrack.com per scaricare le pagine Web, quindi utilizzare Calibre per convertirle tutte in un formato ePub.
바 바

3
Il mio processo è (usando Chrome) di utilizzare il bookmarklet di Instapaper Text per ripulire un po 'le cose, quindi fare clic con il tasto destro -> Salva con nome, scegliere di salvare come una singola pagina Web, solo HTML, quindi aprirlo in Calibre, convertire in EPub, quindi utilizza la funzionalità Modifica libro per riordinare eventuali ulteriori frammenti di markup che vengono inseriti.
El Yobo

6

Il modo in cui ero solito farlo era Calibre.

Questo è diventato troppo doloroso, quindi ho creato un'estensione di Chrome per renderlo più semplice.

Si chiama EpubPress ( http://epub.press ).

Ti consente di creare un ebook dalle tue schede di Chrome.

Spero che sia d'aiuto!


3
Il sito web nel tuo link suggerisce che la confezione si presenta su un server di terze parti, la privacy NON è garantita con questo metodo.
Burgi

Hai suggerimenti per le modifiche che ti farebbero sentire più sicuro? Ho fatto del mio meglio per richiedere solo le informazioni minime nude per la creazione di un libro, ma sono aperto a ulteriori feedback. Se guardi un servizio analogo, scoprirai che qualsiasi contenuto che desideri salvare viene inviato a un server. La differenza è che quei servizi richiedono anche un account e hanno tutti i contenuti associati al tuo nome. Inoltre, non forniscono codice sorgente per i loro siti Web per consentire all'utente di vedere ciò che raccolgono. L'estensione è open source e sono felice di rispondere a qualsiasi domanda su quel codice.
HaroldT,

Che grande strumento! Grazie mille per averlo fornito gratuitamente alla community!
vonjd

5

Pandoc può prendere un collegamento a una pagina (o un file html) e convertirlo in pdf / epub ...

Non sono sicuro che strisciare. In caso contrario, puoi prima eseguire la scansione delle pagine con wget o qualcosa del genere (o semplicemente raccogliere link) e inviarlo a PandC.


secondo la pagina man sarà: "Invece di un file, può essere fornito un URI assoluto. In questo caso pandoc recupererà il contenuto usando HTTP"
jopasserat,


1

HTTrack è una buona opzione - costruirà un ebook da un sito Web: è disponibile per il download da qui: https://www.httrack.com/ HTTrack "consente di scaricare un sito Web da Internet in un locale directory, costruendo ricorsivamente tutte le directory, ottenendo HTML, immagini e altri file dal server al computer. HTTrack organizza la relativa struttura di collegamento del sito originale. "

È quindi possibile convertire l'HTML in EPUB, AZW3 o PDF utilizzando Calibre o qualsiasi altro software di conversione da HTML a epub.

Una seconda opzione per convertire direttamente in EPUB è EpubPress: ha estensioni per consentire l'uso da Firefox (solo v44.0 +) o Chrome. Per utilizzare questo software è necessario aprire una finestra del browser. Ogni scheda è essenzialmente un "capitolo" nel tuo ebook. Disporre le schede nell'ordine di aspetto desiderato, quindi attivare epubpress: scaricherà e disporrà le schede nel loro ordine di aspetto, nel formato .epub. Spero che sia di aiuto!

* Tuttavia, tieni presente che EpubPress scarica pagine Web discrete, non un "sito Web", su HTTrack. Per scaricare un sito Web con EpubPress è necessario aprire ogni collegamento sul sito Web come una scheda separata, quindi utilizzare Epubpress per raccogliere questi collegamenti in formato .epub.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.