C'è un modo per determinare il set di caratteri utilizzato per un dato file di forma?
C'è un modo per determinare il set di caratteri utilizzato per un dato file di forma?
Risposte:
Prova ed errore. Prova ad aprire il file .dbf con Ms Excel o con OpenOffice utilizzando impostazioni diverse fino a ottenere tutto correttamente.
Guarda questo post per ulteriori indizi: /programming/319095/how-do-i-determine-the-character-set-of-a-string
Esistono due modi in cui i programmi possono determinare il set di caratteri per uno shapefile.
L' fileutilità è in grado di indovinare la codifica di un file di testo. Utilizzare ogr2ogrper una conversione che conserva la codifica originale se non è presente alcun .cpgfile :
ogr2ogr -f CSV file.csv file.dbf
file file.csv
Esempio di output:
file.csv: ISO-8859 text
L'ho testato con due delle codifiche più frequenti, UTF-8 e latin1. Funziona subito con Ubuntu, non sono sicuro di OS X. Non sono a conoscenza di fileun'utilità su Windows.
NOTA : non appena c'è un .cpgfile corrispondente che indica la codifica, ogr2ogrla onorerà e l'output sarà in UTF-8. Ma se l'output CSV sembra corretto, sai che le informazioni nel .cpgfile sono accurate.
Un'altra tabella per convertire il 29 ° byte di * .dbf in codepage: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm