Scoprire i metadati su un PDF


32

Supponiamo di avere un PDF e di voler ottenere qualunque metadata sia disponibile per quel PDF. Quale utility dovrei usare?

Trovo che l'informazione che di solito sono più interessato a conoscere è la dimensione della carta, qualcosa che gli utenti di PDF di solito non riportano. Ad esempio, la lettera in formato PDF è legale, A4 o qualcos'altro? Ma anche le altre informazioni disponibili potrebbero essere di interesse.

EDIT: Ecco una guida pratica per i formati di carta, grazie a @terdon.


1
Strano. Perché qualcuno dovrebbe sottovalutare questa domanda? Ti interessa spiegare?
Faheem Mitha,

Risposte:


39

Uno degli strumenti canonici per questo è pdfinfo, che viene fornito con xpdf, se ricordo. Esempio di output:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5

1
In Debian almeno questo fa parte di poppler-utils. Ho un file qui che pdfinfo riporta come 595,2 x 841,44 punti. Ma questo non è riportato come A4. Cosa decide di contrassegnarlo come A4?
Faheem Mitha,

2
I nomi sono hardcoded : la lettera è 612 ± 0,1 x 792 ± 0,1, le dimensioni magiche per DIN / ISO A sono (tutte ± 1 pt): 3370.98, 2383.64, 1685.49, 1191.82, 842.74, 595.91, ..., quindi sembra la tua pagina è un po 'troppo stretta per pdfinforaccoglierla.
Ulrich Schwarz,

Vedo, un po 'di codice if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))?
Faheem Mitha,

Questa è la lettera, i formati A sono in loop con la sqrt(2)s.
Ulrich Schwarz,

13

Un'altra utilità che vale la pena esaminare è exiftool . Potrebbe non essere lo strumento giusto nel tuo caso specifico in quanto non riporta alcuna informazione sulla geometria del documento, ma in generale è probabilmente lo strumento più completo per l'ispezione dei metadati PDF.

Ecco un esempio di un comando che stamperà tutte le meta informazioni disponibili ( -a), ordinate per gruppi ( -G1):

exiftool -a -G1 "$File"

La documentazione ufficiale offre una panoramica dei tag relativi ai PDF supportati:

Puoi installare exiftool su Debian / Ubuntu con:

sudo apt-get install libimage-exiftool-perl

Se sei più interessato alla GUI, puoi provare il mio progetto PDFMtEd . È un insieme di strumenti che fungono da frontend grafici per exiftool e consentono la visualizzazione e la modifica di metadati PDF.

Ecco un paio di schermate:

inserisci qui la descrizione dell'immagine

inserisci qui la descrizione dell'immagine

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.