PDF smart file diff


9

Ho un documento di LibreOffice che ho convertito in PDF ad un certo punto nel tempo usando le funzionalità integrate. Il timestamp sul PDF è più tardi rispetto al documento di elaborazione testi, quindi ha senso, ma non sono assolutamente sicuro che il documento di elaborazione testi produca esattamente quel PDF. Il documento è lungo 20 pagine, quindi non è una buona idea controllarlo manualmente.

Una possibilità è ripetere il PDF in una cartella diversa e quindi fare una diff binaria dei due PDF. Sfortunatamente la riga di comando diffindica che i "file binari sono diversi".

Esiste una "differenza binaria intelligente" che mi aiuterà a determinare se la differenza è solo nei metadati o in qualche differenza non consequenziale?

Risposte:


13

In generale è una buona idea verificare se comando + estensione del file sono ciò che stai cercando. diff + pdf risultati in diffpdf .

sudo apt-get install diffpdf

DiffPDF viene utilizzato per confrontare due file PDF. Per impostazione predefinita, il confronto è del testo su ciascuna coppia di pagine, ma è supportato anche il confronto dell'aspetto delle pagine (ad esempio, se un diagramma viene modificato o un paragrafo riformattato). È anche possibile confrontare pagine o intervalli di pagine particolari. Ad esempio, se esistono due versioni di un file PDF, una con le pagine 1-12 e l'altra con le pagine 1-13 a causa dell'aggiunta di una pagina aggiuntiva come pagina 4, è possibile confrontarle specificando due intervalli di pagine, 1 -12 per il primo e 1-3, 5-13 per il secondo. Ciò renderà DiffPDF confrontare le pagine nelle coppie (1, 1), (2, 2), (3, 3), (4, 5), (5, 6) e così via, con (12, 13).

inserisci qui la descrizione dell'immagine

Fonte: Ubuntugeek.com .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.