Utilità di confronto del testo


5

So che questo è stato chiesto prima, ma ho un giro in quanto ho provato varie offerte di software libero. Voglio sbarazzarmi del dipartimento di DiffDoc. Il problema è che ho problemi a localizzare qualcosa che farà ciò di cui abbiamo bisogno. WinMerge è stato l'ultimo tentativo.

Il problema è semplice Un documento Word e un PDF con una parte di esso contenente il testo da confrontare.

Confrontali e fatti. Testo non elaborato, ignora spazi bianchi, ignora i ritorni a capo, ecc .; e dammi i risultati in una sorta di rapporto.

Abbiamo provato ExamDiff, kdiff3, Tortoise e pochi altri.



6
Questa domanda è più specifica e affronta un problema comune con poche, se del caso, soluzioni comunemente disponibili: confrontare il contenuto testuale dei documenti in due formati diversi, non di testo semplice.
JRobert,

@JRobert sta colpendo l'unghia sulla testa ... sembra così semplice ma nulla sembra affrontarlo ...
Aaron McIver

Sembra solo semplice, motivo per cui nessuno lo ha affrontato. Probabilmente la soluzione migliore è convertire in testo semplice dalle applicazioni native. Neanche l'FSM sa quale testo sia effettivamente contenuto in una parola .doc
msw,

1
Forse dovresti sottolineare questo nella tua domanda @Aaron ;-)
Ivo Flipse

Risposte:


0

Potresti provare a esaminare awk, sed e alcuni script di bash per aiutarti.


1
Ho la sensazione che una lobotomia eseguita con un'arma da fuoco calibro 0,44 sarebbe più rapida e meno dolorosa.
Jonathan Leffler

lol ... sono totalmente d'accordo con te Jonathan :)
tapan

0

Al momento la mia soluzione è un'app hodge-podged. PDFBox per l'estrazione di PDF e Word Interop per i documenti di Word. Riesce a sostituirli sostituendo \ r \ n con "", invia ciascuno di essi a un file .txt, quindi sono pronti per essere confrontati in modo semplice in WinMerge.

Vorrei davvero qualcosa di un po 'più robusto e ufficiale ... ma per ora ... questa è la risposta gratuita ...

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.