Come rimuovere una filigrana da un file PDF?


41

Ho pensato che sarebbe stato un compito semplice, ma si è rivelato al contrario.

La filigrana è la stessa immagine (sovrapposta, ma trasparente) su ogni singola pagina. Ho creato il file PDF da solo (quindi nessuna preoccupazione sul copyright qui) usando PDFCreator 0.9.8.

Ho già provato Adobe Acrobat Pro del mio amico, ma non ha funzionato. Cerca di rimuoverlo, ma non può. Ho provato a rimuovere l'intestazione / piè di pagina, ecc., Ma la filigrana non scompare.

Come posso rimuovere la filigrana?


2
Il PDF è un formato di output, come una pagina stampata elettronica. Non è pensato per essere modificato, e nella maggior parte dei casi non sarai in grado di fare ciò che stai chiedendo a corto di esportare le pagine in immagini e scartare le filigrane.
mk12

I consigli per lo shopping sono fuori tema per tutti i siti Web di scambio di stack. Per evitare che questa domanda si chiuda, raccomanderei di cambiarla in una domanda how, invece di quale
Canadian Luke REINSTATE MONICA

3
Sembra che dovresti semplicemente usare PDFCreator 0.9.8 e impostare l'opzione in modo che una filigrana NON venga aggiunta a ogni pagina. Presumo che questa domanda sia perché non hai la fonte originale.
Ramhound,

Risposte:


73

Per le filigrane basate su immagini, ci sono diversi strumenti che promettono la loro rimozione automatica. Per esempio:

Tutti questi sono gratuiti, ma richiedono una licenza per produrre effettivamente l'output desiderato.

Tuttavia, la filigrana di questo specifico file PDF (che l'OP mi ha inviato via e-mail) non è una singola immagine che si ripete su tutte le pagine. A quanto pare, PDFCreator lo ha hardcoded (quasi pixel per pixel) in ognuno di essi. Ciò rende la filigrana molto più difficile da rimuovere (e si traduce in un file PDF piuttosto gonfio).

Poiché la filigrana è in realtà composta da molte piccole immagini, è possibile rimuoverle con un editor PDF (ad esempio, Foxit Advanced PDF Editor ), semplicemente selezionandole e premendo Delete. Sfortunatamente, devi ripetere questo per ogni pagina.

Una soluzione che richiede meno tempo sarebbe quella di rimuovere la filigrana a livello di codice. Abbiamo bisogno:

passi

  1. Scarica Pdftk ed estrai pdftk.exe e libiconv2.dll in % windir% \ System32 , una directory nel percorso o qualsiasi altra posizione a tua scelta.

  2. Scarica e installa Notepad ++.

  3. I flussi PDF vengono generalmente compressi utilizzando l' algoritmo DEFLATE . Ciò consente di risparmiare spazio, ma rende illeggibile del PDF.

    Il comando

    pdftk original.pdf output uncompressed.pdf uncompress
    

    decomprime tutti i flussi, quindi possono essere modificati da un editor di testo.

  4. Apri uncompressed.pdf con Notepad ++ per rivelare la struttura della filigrana.

    In questo caso specifico, ogni pagina inizia con il blocco

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    e quasi 4.000 blocchi proprio come questo. Questo particolare blocco imposta solo uno ( /W 1 /H 1) dei pixel della filigrana.

    Scorrendo verso il basso fino a quando il pattern non cambia rivela che il flusso della filigrana è lungo 95.906 byte (contando le nuove righe). Lo stesso flusso esatto si ripete su ogni pagina del file PDF.

  5. Premere Ctrl+ He impostare quanto segue:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    L'espressione regolare q 9 0 0 9 2997 4118\.67 cm.{95881}corrisponde alla prima riga del blocco sopra ( q 9 0 0 9 2997 4118.67 cm) e tutti i seguenti 95.881 caratteri, ovvero il flusso della filigrana.

    Fare clic su Sostituisci tutto lo rimuove da tutte le pagine del file PDF.

  6. La filigrana è stata ora rimossa, ma il file PDF presenta errori (la lunghezza dei flussi non è corretta) ed è non compressa.

    Il comando

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    si prende cura di entrambi.

  7. uncompressed.pdf non è più necessario. Puoi cancellarlo.

Il risultato è lo stesso PDF senza filigrana (e circa la metà delle dimensioni).


4
Un altro trucco che ho trovato utile: è stato difficile per me capire il blocco corrispondente alla filigrana nel mio PDF. Quindi quello che ho fatto è stato solo estrarre una singola pagina dal PDF, idealmente una pagina in cui c'è solo la filigrana e non molto altro. Da questa sola pagina, dovrebbe essere più facile capire il blocco che corrisponde alla filigrana. Quindi torna indietro e fallo per il PDF originale.
Kenny LJ,

1
Wow, questo è il primo posto su Internet che ho trovato un buon modo per gestirlo. Qualche posto che consigli di leggere sul formato del contenitore?
ConstantineK,

2
@Hobs IIRC, ho letto parti del riferimento PDF ufficiale per scrivere questa risposta.
Dennis,

1
Grazie @Dennis, ti ho già dato un voto, ma questa sembra essere la migliore fonte canonica. Sono stato in grado di ottenere ciò di cui avevo bisogno facendo solo qualche ricerca / sostituzione e alcune prove di compressione aggiuntive ed esecuzioni di errori. ENORME AIUTO!
ConstantineK,

7
Invece di pdftkte puoi anche usare qpdf per decomprimere e comprimere i file pdf. Comandi: qpdf --stream-data=uncompress original.pdf uncompressed.pdfeqpdf --stream-data=compress uncompressed.pdf nowatermark.pdf
David Schuler,

6

Sembra che la filigrana sia effettivamente parte delle immagini all'interno di .PDF e non un'immagine separata renderizzata su di essa da qualsiasi cosa tu stia usando per visualizzare .PDF. Potrebbe non essere possibile rimuovere la filigrana senza estrarre le immagini da .PDF, eseguirle attraverso un editor di immagini e quindi ricostruire manualmente .PDF.


4

Per le filigrane di testo, la modifica di una versione PostScript può essere molto più semplice: Dopo

$ pdftops document.pdf

modificare document.ps, quindi riconvertirlo in PDF tramite

$ ps2pdf document.ps


Su Linux, fai attenzione pdftopse pdf2pssono diversi. Usa il primo comando, non il secondo.
Camille Goudeseune,

1
Se sai qual è il testo della filigrana, ecco una riga. pdftops in.pdf - | sed 's/WATERMARK//' | ps2pdf - out.pdf
Camille Goudeseune,

1

Gli artefatti del timbro sono che puoi eliminarlo all'interno di Adobe Acrobat Pro, tuttavia si rigenera muovendo il mouse perché l'oggetto stream lo mantiene persistente.

Se provi a modificare la fonte pdf, il che è complicato, c'è la possibilità che il file sia danneggiato.

Se il timbro è un flusso, possiamo interromperlo scollegando il computer dalla rete, cosa che ho fatto.

Quindi, utilizzando Adobe Acrobat Pro, ho selezionato una delle mie annotazioni, ho fatto clic con il pulsante destro del mouse per visualizzare il popup e ho selezionato "Mostra elenco commenti".

Seleziona la filigrana / timbro nefasto dall'elenco, fai clic con il pulsante destro del mouse per visualizzare il popup e seleziona "Elimina". Fallo su ogni pagina in cui si verifica l'apposizione.

Salva il file con un altro nome. La mia applicazione si è bloccata, ma non prima di salvare il file!

Apri il nuovo file molto più piccolo; si noti che tutte le filigrane / timbri sono bizzarri.

Nel mio caso, la dimensione del file del mio documento di 3 pagine si è ridotta da 300 KB a un impressionante 60 KB. Tutti i dati e le annotazioni originali sono rimasti intatti - senza le filigrane.

~ Buona caccia: o)


1

converti il ​​documento in file .rtf usando zamzar. Il segno d'acqua scompare automaticamente dopo la conversione. Nota: - Funziona perfettamente se il documento contiene materiale di testo. È sempre stato di grande aiuto .. (utente Mac)


Questo non funziona per il PDF che ho provato.
Kenny LJ,

1

Trovato un altro modo per farlo:

  1. Utilizza lo strumento pdf2htmlEX (o qualsiasi altro convertitore da PDF a HTML) per convertire il PDF in un file HTML.
  2. Modifica HTML con un editor di testo e rimuovi la filigrana. Salvarla.
  3. Stampa in HTML su un nuovo documento PDF
  4. Profitto

Grazie. Sei sicuro di non poter rimuovere la filigrana con Adobe Acrobat in questo modo? (Questa potrebbe essere davvero una soluzione più economica.)
Apache il

Credo che tu abbia bisogno di una sorta di password per rimuovere la filigrana all'interno di Adobe Reader, quindi ho usato questo metodo.
Dominik Antal,

0

Questo è un supplemento alla risposta di @Dennis del 18:06 del 30 luglio 2012. Sicuramente affronta il caso più difficile.

Nel caso più semplice in cui la filigrana è semplice, ad esempio testo non ornato

Smedley per il commissario

le filigrane PDF non compresse potrebbero essere definite in questo modo:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

dove si 75.96trova l'offset orizzontale e 625l'offset verticale per questa particolare istanza di filigrana. (Sì, possono essere visti sia numeri reali che numeri interi.)

Una regexp come la seguente funzionerà per tutte queste filigrane, ignorando qualsiasi variazione nel loro posizionamento:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Tenere presente, tuttavia, che una varietà di operatori PDF che modificano può entrare in gioco con filigrane che hanno una formattazione più complicata. Tale fantasia può trasformare ciò che il lettore si aspetta (spera?) Da una stringa contigua e facilmente ricercabile in un pasticcio di zuppa di alfabeto. Per esempio,

E 1 = mc² di Smedley ™

Potrebbe essere il prodotto di questo:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. . . o molto peggio se la tua filigrana è migliorata dal colore!

Avendo notato tutto ciò, noterò anche che PDFtk ha una versione GUI che pretende di gestire filigrane, in considerazione di una tassa di licenza di $ 4. Non è affatto costoso!

D'altra parte, trovo che il suo sito web pubblicizzi attualmente il pieno supporto per O / S attraverso Windows 8e OS X 10.8 Mountain Lion. Quell'annata è finita 4 anni fa. PDFtk potrebbe essere obsoleto? Sospetto di no, ma non lo so.


Grazie per la raccomandazione PDFtk, sembra pulito, ma sì anche "odora" un po 'oudated. La versione gratuita è 2.02 e Wikipedia dice che è stato effettivamente rilasciato 3 anni fa: en.wikipedia.org/wiki/PDFtk
Apache il

1
@Shiki - in realtà, ho fatto alcune ricerche serie sui formati PDF, ma ho eliminato la mia valutazione dettagliata dei progressi del PDF negli ultimi 10 anni. Ecco il riassunto: "Mancanze di una versione PDFtk da 3 anni alla luce dello sviluppo delle specifiche PDF". Sebbene ci siano stati diversi aggiornamenti da quando, diciamo, nel 2005, _ starai bene con _PDFtk_ con ogni probabilità. Lo dico dopo aver controllato alcune fonti di documenti PDF comunemente disponibili e moderne. Tutti i documenti PDF che ho controllato sono stati creati secondo gli standard PDF precedenti al 2010 ( ben prima, in realtà.) In caso di dubbi, controlla le prime decine di byte del file PDF in questione.
Der Schley,

0

Qui ci sono modi gratuiti ea pagamento per farlo, ti suggerisco di utilizzare Google Drive.

Google Drive ha la capacità di aprire file e apportare alcune modifiche minori. Inoltre, può essere utilizzato per rimuovere la filigrana dal PDF online.

  1. Apri il tuo account Google Drive, che è sostanzialmente lo stesso del tuo account Gmail.
  2. Fare clic su "Nuovo"> "Caricamento file", selezionare un documento PDF e caricarlo.
  3. Una volta fatto, puoi controllare il file caricato sul tuo Drive, quindi fare clic con il tasto destro per aprirlo con "Google Docs".
  4. Successivamente, la filigrana verrà rimossa automaticamente. Per salvarlo, vai su "File" e fai clic su "Scarica come", quindi seleziona "Documento PDF".
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.