Come sfogliare la struttura PDF interna in Adobe 9.0?
Non ho trovato il menu avanzato con questa opzione.
Qualcuno può aiutarmi?
Come sfogliare la struttura PDF interna in Adobe 9.0?
Non ho trovato il menu avanzato con questa opzione.
Qualcuno può aiutarmi?
Risposte:
Esistono diversi modi per sfogliare la struttura interna di un PDF.
Escludendo le password di sicurezza, molte di queste sono leggibili dall'uomo. Se un PDF ha una password, tutte le stringhe e i flussi (che saranno già compressi, nessuna perdita) saranno spazzatura pseudocasuale. I flussi di dati compressi abbondano, ma in gran parte sembra simile a questo nel tuo editor di testo preferito:
2 0 obj
<< /Type /Page
/MediaBox [0 0 612 792]
/Contents 4 0 R
/Resources << /Fonts
<< /F1 5 0 R>>
>>
>>
endobj
Avvertenza: gli spazi bianchi sono in gran parte irrilevanti e generalmente rimossi quando possibile. L'ho appena reso carino per renderlo più semplice.
<< e >> iniziano e finiscono i "dizionari". I dizionari sono costituiti da coppie chiave / valore. La chiave è sempre un "nome": tutti i nomi iniziano con '/'. Il valore può essere qualsiasi cosa, incluso un altro nome.
[ e ] iniziano e finiscono gli "array". Le matrici possono essere costituite praticamente da qualsiasi cosa.
I numeri sono "numeri". Virgola mobile o altro.
() e <> iniziano e finiscono le "stringhe". Le stringhe <> sono elencate come valori esadecimali, () sono stringhe ANSI.
Pet Peeve: / Names e (Strings) usano sistemi di escape completamente diversi. Grr.
I riferimenti indiretti puntano ad altri oggetti nel PDF:
<objNum> <generationNum-AlwaysZero> R
Nell'oggetto di esempio sopra riportato, il flusso di contenuto è nell'oggetto 4, altrove nel PDF. Per trovarlo, puoi usare la ricerca del testo dei tuoi editor per "N 0 obj" dove N è il numero oggetto che desideri.
ATTENZIONE: ci sono centinaia, forse migliaia di oggetti in un PDF. La ricerca di "1 0 obj" ti farà ottenere MOLTI successi.
Dato che stai chiedendo di vedere la struttura interna, probabilmente già sai tutto questo. Altri che vogliono sapere la stessa cosa potrebbero non esserlo.
ATTENZIONE: non MODIFICARE un PDF in un editor di testo. Tutta quella roba binaria verrà alterata, gli offset dei byte sono molto importanti in PDF.
Esiste un plug-in Acrobat chiamato PDF CanOpener di Windjack Solutions (nessuna affiliazione). È LENTO. Sarai in grado di sfogliare la struttura PDF come un albero, guardare (e modificare) i flussi di contenuti e così via.
Molte. Molte persone ne costruiscono una come parte dell'apprendimento dell'analisi del PDF o come strumento di debug. Sono abbastanza pratici.
iText RUPS (parte di iText, una libreria Java PDF, ora su GitHub)
O2Solutions offre un'utilità compatibile MS Windows per visualizzare la struttura interna dei documenti PDF. È gratuito per uso personale e commerciale.
Puoi sfogliare la struttura PDF interna in Adobe Acrobat usando esso Browse Internal PDF Structure
comando dal plug-in Preflight:
http://www.jpedal.org/PDFblog/2009/04/viewing-pdf-objects/
Puoi anche utilizzare il plug-in CanOpener PDF commerciale per Acrobat per visualizzare la struttura degli oggetti o PDFedit gratuito per decodificare i flussi di dati compressi in PDF.
PoDoFoBrowser è una piccola utility portatile gratuita che consente non solo di esplorare la struttura PDF interna, ma anche di esportare, importare e modificare i dati degli oggetti. Può essere scaricato da qui:
http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/
Ecco come appare sotto Windows:
L' editor PDF-XChange gratuito ha un pannello Contenuto che consente di visualizzare la struttura ad albero del file PDF.
View -> Panes -> Content
PDF Vole sembra essere rotto. Se qualcuno è ancora alla ricerca di uno strumento, sto usando l' analizzatore PDF gratuito .
PDF Vole
il collegamento sembra essere interrotto ora ...