C'è un modo per determinare il set di caratteri utilizzato per un dato file di forma?
C'è un modo per determinare il set di caratteri utilizzato per un dato file di forma?
Risposte:
Prova ed errore. Prova ad aprire il file .dbf con Ms Excel o con OpenOffice utilizzando impostazioni diverse fino a ottenere tutto correttamente.
Guarda questo post per ulteriori indizi: /programming/319095/how-do-i-determine-the-character-set-of-a-string
Esistono due modi in cui i programmi possono determinare il set di caratteri per uno shapefile.
L' file
utilità è in grado di indovinare la codifica di un file di testo. Utilizzare ogr2ogr
per una conversione che conserva la codifica originale se non è presente alcun .cpg
file :
ogr2ogr -f CSV file.csv file.dbf
file file.csv
Esempio di output:
file.csv: ISO-8859 text
L'ho testato con due delle codifiche più frequenti, UTF-8 e latin1. Funziona subito con Ubuntu, non sono sicuro di OS X. Non sono a conoscenza di file
un'utilità su Windows.
NOTA : non appena c'è un .cpg
file corrispondente che indica la codifica, ogr2ogr
la onorerà e l'output sarà in UTF-8. Ma se l'output CSV sembra corretto, sai che le informazioni nel .cpg
file sono accurate.
Un'altra tabella per convertire il 29 ° byte di * .dbf in codepage: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm