Sfoglia la struttura PDF interna


18

Come sfogliare la struttura PDF interna in Adobe 9.0?

Non ho trovato il menu avanzato con questa opzione.

Qualcuno può aiutarmi?

pdf 

Risposte:


23

Esistono diversi modi per sfogliare la struttura interna di un PDF.

I PDF sono leggibili dall'uomo

Escludendo le password di sicurezza, molte di queste sono leggibili dall'uomo. Se un PDF ha una password, tutte le stringhe e i flussi (che saranno già compressi, nessuna perdita) saranno spazzatura pseudocasuale. I flussi di dati compressi abbondano, ma in gran parte sembra simile a questo nel tuo editor di testo preferito:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Avvertenza: gli spazi bianchi sono in gran parte irrilevanti e generalmente rimossi quando possibile. L'ho appena reso carino per renderlo più semplice.

<< e >> iniziano e finiscono i "dizionari". I dizionari sono costituiti da coppie chiave / valore. La chiave è sempre un "nome": tutti i nomi iniziano con '/'. Il valore può essere qualsiasi cosa, incluso un altro nome.

[ e ] iniziano e finiscono gli "array". Le matrici possono essere costituite praticamente da qualsiasi cosa.

I numeri sono "numeri". Virgola mobile o altro.

() e <> iniziano e finiscono le "stringhe". Le stringhe <> sono elencate come valori esadecimali, () sono stringhe ANSI.

Pet Peeve: / Names e (Strings) usano sistemi di escape completamente diversi. Grr.

I riferimenti indiretti puntano ad altri oggetti nel PDF:
<objNum> <generationNum-AlwaysZero> R

Nell'oggetto di esempio sopra riportato, il flusso di contenuto è nell'oggetto 4, altrove nel PDF. Per trovarlo, puoi usare la ricerca del testo dei tuoi editor per "N 0 obj" dove N è il numero oggetto che desideri.
ATTENZIONE: ci sono centinaia, forse migliaia di oggetti in un PDF. La ricerca di "1 0 obj" ti farà ottenere MOLTI successi.

Dato che stai chiedendo di vedere la struttura interna, probabilmente già sai tutto questo. Altri che vogliono sapere la stessa cosa potrebbero non esserlo.

ATTENZIONE: non MODIFICARE un PDF in un editor di testo. Tutta quella roba binaria verrà alterata, gli offset dei byte sono molto importanti in PDF.

Plug-in Acrobat [s]

Esiste un plug-in Acrobat chiamato PDF CanOpener di Windjack Solutions (nessuna affiliazione). È LENTO. Sarai in grado di sfogliare la struttura PDF come un albero, guardare (e modificare) i flussi di contenuti e così via.

App di terze parti

Molte. Molte persone ne costruiscono una come parte dell'apprendimento dell'analisi del PDF o come strumento di debug. Sono abbastanza pratici.

iText RUPS (parte di iText, una libreria Java PDF, ora su GitHub)

Browser degli oggetti PDF

PDF Vole


1
PDF Voleil collegamento sembra essere interrotto ora ...
DNA

5
+1 per iText RUPS, non proprio una GUI intuitiva ma funziona, a quanto pare attualmente l'URL del progetto ( sourceforge.net/projects/itextrups )
Jaime Hablutzel

2
iText RUPS è stato spostato qui: github.com/itext/rups
bmaupin

1
C'è una copia del codice sorgente di pdfvole qui: github.com/Rossi1337/pdf_vole
yms

1
Se il PDF ha flussi di dati compressi, l'utilità della riga di comando qpdf può decodificarli / sgonfiarli e scrivere un PDF con contenuti più comprensibili: `qpdf --decode-level = all --stream-data = decompress inputfile.pdf extendedfile. pdf
skierpage




2

L' editor PDF-XChange gratuito ha un pannello Contenuto che consente di visualizzare la struttura ad albero del file PDF.

View -> Panes -> Content

2

PDF Vole sembra essere rotto. Se qualcuno è ancora alla ricerca di uno strumento, sto usando l' analizzatore PDF gratuito .

inserisci qui la descrizione dell'immagine

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.