Come rimuovere la filigrana dal pdf usando pdftk?


33

Devo rimuovere qualche stupida filigrana di posta elettronica che si espande su tutte le pagine di un libro di dominio pubblico. Ho guardato la pagina man di pdftk e alcuni esempi, ma ancora non riesco a capire come rimuovere le filigrane. Apprezzo i tuoi suggerimenti.

Risposte:


35

compito molto semplice da eseguire:

usa sed:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf

ma, dopo, assicurati di riparare l' output pdf risultante

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

tutto in un solo comando:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

le filigrane di testo non sono altro che un testo tra due tag all'interno del codice compresso pdf


1
Fantastico! ha funzionato come un fascino. ti preghiamo di rinominare l'indirizzo e-mail in uno fittizio. Non voglio che il ragazzo abbia rovinato il libro agli spammer. Specialmente perché è probabilmente colui che ha realizzato il pdf. Grazie molto.
Inni il

fatto! Modificata stringa specifica con una stringa generica

Qualcuno sa come modificare questa soluzione per sbarazzarsi di una filigrana di collegamento? Mi sono sbarazzato del testo, ma rimane ancora un quadratino dove si trovava il testo.
425nesp

pdftk si è arrestato in modo anomalo quando l'ho eseguito.
Cerin,

@Dingo come lo elaborano in batch? Intendo file multipli
Clain Dsilva,

49

Solo un piccolo componente aggiuntivo alla risposta di Dingo in quanto non ha funzionato per me:

Ho dovuto prima decomprimere il documento PDF per poter trovare la filigrana e sostituirla con sed. Il primo passo consiste nel decomprimere il documento PDF usando pdftk:

pdftk original.pdf output uncompressed.pdf uncompress 

ora, uncompressed.pdfpuò essere usato come nella risposta di Dingo:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf

Ho quindi riparato e ricompresso il documento:

pdftk unwatermarked.pdf output fixed.pdf compress

Sei un salvavita! Grazie!!! :)
johndodo,

1
Questo è davvero fantastico!
Qed

4
Ho preso questo processo, l'ho reso un po 'più elaborato e lo ho avvolto in uno script Python. È su github qui .
Alexander Garden,

@Alexander Garden Non funziona, TypeError: str() takes at most 1 argument (2 given)se utilizzato seguendo i consigli di utilizzo forniti
8bitjunkie,

2
Non ha funzionato per rimuovere la filigrana aggiunta da Master PDF Editor.
fccoelho,

-2

Per rimuovere www.it-ebooks.info,

apri il PDF in notepad ++ o textpad

sostituire www.it-ebooks.info con nulla (vuoto)

salva il file

Apri in Adobe Reader standard

Esci, ti verrà richiesto di salvare il file

salvarla


1
Questa è una soluzione generale? Cosa è www.it-ebooks.info?
Karlo
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.