Penso che il tuo approccio migliore sarebbe convertire il PDF in immagini con una risoluzione decente e poi fare un confronto delle immagini.
Per generare immagini da PDF è possibile utilizzare Adobe PDF Library o la soluzione suggerita in Modo migliore per convertire i file pdf in file tiff .
Per confrontare i file TIFF generati ho trovato GNU tiffcmp (per windows parte di GnuWin32 tiff ) e tiffinfo ha fatto un buon lavoro. Usa tiffcmp -l e conta il numero di righe di output per trovare eventuali differenze. Se sei felice di avere una piccola quantità di modifiche al contenuto (ad esempio differenze di anti-aliasing), usa tiffinfo per contare il numero totale di pixel e puoi quindi generare un valore di differenza percentuale.
A proposito, per chiunque effettui un semplice confronto PDF in cui la struttura non è cambiata, è possibile utilizzare diff da riga di comando e ignorare determinati modelli, ad esempio con GNU diff 2.7:
diff --brief -I xap: -I xapMM: -I / CreationDate -I / BaseFont -I / ID --binary --text
Questo ha ancora il problema che non rileva sempre le modifiche nei nomi dei caratteri generati.