controllo della versione di PDF con annotazioni


3

Ho un sacco di file PDF importanti. L'unico modo per modificarli è aggiungere / rimuovere annotazioni. Esiste un modo efficace per avere il controllo della versione per tali file. Posso forse usare strumenti standard come SVN / Git. Ho sentito che SVN memorizza solo delta anche per i file binari. Nel caso di SVN / GIT, i delta sarebbero enormi se tutto quello che facevo fosse cambiare le annotazioni in un file PDF? Immagino che non saranno grandi ma non sono sicuro di come le annotazioni siano archiviate nei file PDF e di quanto siano intelligenti gli algoritmi delta.

Risposte:


1

In un progetto attivo, usiamo git per fare il controllo della distribuzione e della versione. Alcuni dei file sono PDF e funzionano abbastanza bene. Come è stato detto, non c'è modo di fare delta.

Una possibilità, tuttavia, che potrebbe funzionare con delta, sarebbe l'esportazione dei commenti, che vengono fuori come FDF, e quindi il controllo della versione con questi file di esportazione. FDF può, se i commenti non sono troppo grandi, essere semplici file di testo; dovresti eseguire i test, comunque.


1

È possibile decomprimere PDF con un numero di strumenti (qpdf, pdftk, mutool, cpdf). Per esempio:

pdftk original.pdf output uncompressed.pdf uncompress

Questo dovrebbe darti il ​​PDF in un formato in cui puoi vedere e diffare le annotazioni come testo in chiaro. Il file non compresso di solito contiene in gran parte caratteri ASCII, ma potrebbe comunque contenere dati binari. Dovresti testare come funziona con il software di controllo delle versioni di tua scelta e se funziona bene con i dati binari "incorporati".

La domanda è che cosa succede quando modifichi le annotazioni (con un editor della GUI, presumo), salva il file e lo scompattiamo. Se sei fortunato, il file sarà in gran parte lo stesso ad eccezione delle annotazioni, ma non è garantito. Dovrai scegliere saggiamente la tua combinazione di software.


0

Non conosco alcuna versione nativa con file PDF (né la mia ricerca su Google). I file PDF (secondo wikipedia) sono binari. Lo storage Delta funziona solo con file di testo (come file di codice sorgente e file readme).

Ho uno sfondo nell'utilizzo di SVN e Git. Raccomando l'uso di Git, in quanto ha capacità di compressione superiori ed è un sistema di controllo della versione distribuito. Subversion è un sistema di controllo della versione centralizzato, il che significa che è necessario un server per eseguirlo. È possibile installare il software del server SVN sul computer, ma probabilmente non ne vale la pena. I sistemi di controllo versione distribuiti funzionano tramite repository locali (ad esempio: nessun server richiesto).


Il secondo paragrafo è totalmente irrilevante per la domanda. Non ho chiesto delle differenze tra SVN e Git. Inoltre, nel primo paragrafo, la seconda riga potrebbe essere errata in quanto la risposta di Thomas suggerisce che i file PDF possono essere decompressi dopo di che saranno costituiti in gran parte da caratteri ascii.
Abhishek Anand
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.