I file Excel possono essere convertiti in CSV usando:
$ libreoffice --convert-to csv --headless --outdir dir file.xlsx
Tutto sembra funzionare bene. La codifica, tuttavia, è impostata su qualcosa di instabile. Invece di un mdash UTF-8 (-) che ottengo se eseguo un "salvataggio con nome" manualmente da LibreOffice Calc, mi dà un \ 227 ( ). L'uso del file sul CSV mi dà "testo ASCII esteso non ISO, con linee molto lunghe". Quindi, due domande:
- Cosa diavolo sta succedendo qui?
- Come posso dire a libreoffice di convertire in UTF-8?
Il file specifico che sto cercando di convertire è qui .