Copia di testo semplice da file generato in lattice


0

Sto cercando di apportare alcune correzioni a un PDF documentato generato dal lattice.

Per fare le correzioni, prima copio il testo dal PDF.

Quello che succede è che nel PDF generato, le parole vengono tagliate a destra quando non si adattano al margine, ad esempio, quando la parola "paragrafo" è troppo grande per adattarsi, verrà tagliata come:

word1 word2\n 
word3 para-\n
graph word4\n

Inoltre, le interruzioni di riga non vengono eseguite quando necessario, ma sono sempre alla fine del testo.

Non ho accesso all'originale. Quindi questo è un problema quando copio il testo per modificarlo da qualche parte, mentre finisco con un mucchio di interruzioni di riga e interruzioni di parole non necessarie (non sono sicuro di come questi ultimi siano davvero chiamati).

C'è un modo per copiare correttamente il testo dal file pdf?

È qualcosa che il file PDF fa affinché le parole si adattino perfettamente alla pagina, senza giustificazione testuale?


Quindi qual è la tua domanda esattamente? Potrebbe anche essere più adatto allo scambio di stack LaTeX. In tal caso, contrassegnalo per la migrazione.
user2313067

lo lascerò qui per un po ', dato che anche questo potrebbe essere collegato al pdf, non ne sono sicuro.
fullmooninu,

Risposte:


0

Questi due regex eseguiti in quell'ordine dovrebbero funzionare.

s/-\n//g
s/([^.])\n/$1 /g
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.