Come convertire un file pdf in un file odt?


32

Voglio convertire un .pdffile in un .odtfile in modo da poterlo ulteriormente convertire in un .docfile. C'è qualche software / script che può fare questo. Ho provato a copiare il contenuto del .pdffile e incollato in liberoffice writer la formattazione non viene conservata.

Il documento è riservato, quindi preferirei non utilizzare alcun servizio online per la conversione.

Qualsiasi aiuto è molto apprezzato.


Correlati (ma non un duplicato!): Come convertire un odt in pdf?
Eliah Kagan,

1
Per domande specifiche su LIBREOFFICE / OpenOffice, raccomando ask.libreoffice.org
Bucic,

Risposte:


15

Sono stato infastidito dalla mancanza di un convertitore gratuito da PDF a ODT. Non avevo nemmeno bisogno di nulla di complicato. Solo uno strumento che genera file ODT che posso quindi annotare in LibreOffice (ad es. Per compilare moduli).

So come farlo manualmente, convertendo il documento PDF in file grafici e quindi importandoli in LibreOffice, ma diventa noioso abbastanza velocemente.

Quindi, ho finalmente scritto un breve script di shell che esegue automaticamente tutti i passaggi necessari. Puoi trovarlo su https://github.com/gutschke/pdf2odt

Può accettare qualsiasi numero di file PDF e di immagine come input e genera un file ODT che può essere aperto e modificato in LibreOffice. Le immagini vengono visualizzate come sfondo della pagina, in modo da poterle scrivere liberamente. Ogni immagine è associata al suo stile di pagina. Tienilo a mente quando inserisci le interruzioni di pagina e regola lo stile della pagina secondo necessità.

Ho testato lo script sia su Linux che su Mac. Dato che necessita solo di una manciata di strumenti ragionevolmente standard, dovrebbe essere abbastanza portatile.


Questo script crea schermate di ogni pagina e le inserisce nel formato di destinazione, Grazie per la sceneggiatura Gutschke
Oliver

L'avevo usato pdf2ooqualche anno fa, ma sembra che ora produca file corrotti per LibreOffice. Questo script fa questo e altro ancora - grazie!
eacousineau,

3
Lo script pdf2odt, sfortunatamente, viene convertito in un formato immagine utilizzato come sfondo ODT. Non aspettarti di essere in grado di "modificare" il testo originale.
Richard Elkins,

13

Puoi dare un'occhiata a PDF Utilities(poppler-utils via Synaptic o apt-get) che include pdftotext :

Poppler è una libreria di rendering PDF basata sul visualizzatore PDF Xpdf.

Questo pacchetto contiene utilità da riga di comando (basate su Poppler) per ottenere informazioni su documenti PDF, convertirli in altri formati o manipolarli:
* pdfdetach - elenca o estrae file incorporati (allegati)
* pdffonts - analizzatore di font
* pdfimages - estrattore di immagini
* pdfinfo - informazioni sul documento
* pdfseparate - strumento di estrazione di pagine
* pdftocairo - convertitore da PDF a PNG / JPEG / PDF / PS / EPS / SVG usando Cairo
* pdftohtml - convertitore da PDF a HTML
* pdftoppm - da PDF a PPM / PNG / JPEG image converter
* pdftops - convertitore da PDF a PostScript (PS)
* pdftotext - estrazione del testo
* pdfunite - strumento di fusione dei documenti

Naturalmente, il successo dipenderà da come è stato generato il file pdf. Se si ottiene ciò che si vuole come un file di testo, si potrebbe quindi salvare che come file .odt.

Modifica: ho dimenticato di fornire la fonte per il preventivo. Viene dalla scheda della descrizione in Synaptic perPDF Utilities (based on Poppler).


3
Da questo elenco, pdftohtmldeve essere la soluzione migliore per l'attività, poiché l'HTML può contenere la formattazione. Quindi l'HTML potrebbe essere convertito in ODT o DOC.
imz - Ivan Zakharyaschev,

10

LibreOffice è in grado di importare .pdffile. Basta aprirlo in una versione corrente di LibreOffice per i migliori risultati. Tuttavia, aprirà il documento come disegno e sarai in grado di convertirlo solo in uno dei formati di immagine supportati, non come documento di Writer.

Naturalmente, non tutta la formattazione viene preservata, ma almeno alcune.


1
L'ho provato di recente, ed è semplicemente orribile, non salva nemmeno un po 'di formattazione. Inoltre, rende il testo illeggibile.
Ciao Angelo

3

Se è installato il pacchetto poppler-utils , lo script Nautilus di seguito (da inserire nella cartella ~ / .gnome2 / nautilus-scripts come file eseguibile) aiuterà a convertire i file PDF in HTML (l'opzione "-i" può essere eliminata per includere anche immagini), che possono quindi essere aperte con LibreOffice Writer e salvate come ODT, sebbene il successo della formattazione della conversione dipenda molto dalla modalità di creazione del PDF.

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym


Grazie per questo utile script. Solo una piccola osservazione (da man pdftohtml): -noframes : generate no frames. Not supported in complex output mode.quindi -noframesnon avrà alcun effetto con -cset.
Glutanimate,

2
Grazie, ho rimosso questa opzione ridondante dal mio script ora. Uno script bash basato su zenity per fornire una GUI per tutte queste opzioni sarebbe molto bello a quanto pare ;-)
Sadi

#MHC, sembra che questa informazione sia sbagliata; se non includiamo -noframes otteniamo file html separati per le pagine pdf; così l'ho inserito di nuovo nella mia sceneggiatura.
Sadi,

È strano. Quindi deve essere un errore nella documentazione. Cambierò di conseguenza la mia copia dello script. Grazie per il testa a testa!
Glutanimate,

3

Prova Calibre. Si converte in HTML e quindi in altri formati. Ha fatto un ottimo lavoro su un file di grandi dimensioni (183 pagine) che altrimenti avrei dovuto stampare.

Nel mio caso l'ho convertito in un epub, ma per divertimento l'ho convertito in un .docx che si è rivelato molto bene.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.