Ho bisogno di ottenere migliaia di frammenti di testo da PDF a un foglio di calcolo. Sono brevi, raramente più di 2-3 righe, ma ogni interruzione di riga crea una nuova cella e devo ripararla manualmente, il che costa molto tempo.
Perché ne ho così tanti, usare la soluzione "incolla in Word e trova e sostituisci" è semplicemente una perdita di tempo per me. C'è un modo per far scomparire l'interruzione di linea sulla copia? Forse c'è un visualizzatore che offre una modalità di copia speciale per questo o ha un plugin?
I documenti sono articoli scientifici. La disposizione del testo è abbastanza lineare. Puoi presumere che il testo che sto copiando non sia all'interno di una tabella o di un float e non sia ruotato o altro. (Se succede una cosa del genere, penso che la tratterò manualmente). Il testo è spesso impostato su due colonne, ma non ho problemi a contrassegnare solo il testo che mi serve dalla sua colonna. Non ho bisogno di conservare alcuna formattazione speciale. Sono disposto a provare una soluzione che rimuove tutti i caratteri non stampabili, ad esempio. I testi sono in inglese, va bene se la soluzione funziona solo in ASCII / rimuove tutte le ASCII non alfanumeriche del testo copiato.
Ho una forte preferenza per una soluzione che funzionerà su Linux, forse una sorta di plugin Okular. Ma se dovesse esserci una soluzione solo per Windows, ne voglio sapere anche io. Ho una licenza per un Acrobat Pro un po 'recente sul computer Windows.