Questo è un supplemento alla risposta di @Dennis del 18:06 del 30 luglio 2012. Sicuramente affronta il caso più difficile.
Nel caso più semplice in cui la filigrana è semplice, ad esempio testo non ornato
Smedley per il commissario
le filigrane PDF non compresse potrebbero essere definite in questo modo:
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
dove si 75.96
trova l'offset orizzontale e 625
l'offset verticale per questa particolare istanza di filigrana. (Sì, possono essere visti sia numeri reali che numeri interi.)
Una regexp come la seguente funzionerà per tutte queste filigrane, ignorando qualsiasi variazione nel loro posizionamento:
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
Tenere presente, tuttavia, che una varietà di operatori PDF che modificano può entrare in gioco con filigrane che hanno una formattazione più complicata. Tale fantasia può trasformare ciò che il lettore si aspetta (spera?) Da una stringa contigua e facilmente ricercabile in un pasticcio di zuppa di alfabeto. Per esempio,
E 1 = mc² di Smedley ™
Potrebbe essere il prodotto di questo:
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
. . . o molto peggio se la tua filigrana è migliorata dal colore!
Avendo notato tutto ciò, noterò anche che PDFtk ha una versione GUI che pretende di gestire filigrane, in considerazione di una tassa di licenza di $ 4. Non è affatto costoso!
D'altra parte, trovo che il suo sito web pubblicizzi attualmente il pieno supporto per O / S attraverso Windows 8
e OS X 10.8 Mountain Lion
. Quell'annata è finita 4 anni fa. PDFtk potrebbe essere obsoleto? Sospetto di no, ma non lo so.