Vorrei chiamare un'utilità della riga di comando in Mac OS X 10.8 che mi dà la possibilità di convertire un file di testo salvato nella codifica romana Western Mac OS standard nel più generico UTF-8.
Chiamerò l'utilità da un AppleScript che ho creato. AppleScript è estremamente lento quando si lavora con blocchi di testo molto grandi. Pertanto, desidero eseguire l'analisi e la conversione del mio testo utilizzando la riga di comando di OS X. Ho trovato uno strumento chiamato "sed", che mi permette di eseguire l'analisi del testo. Tuttavia, ci sono ancora molti elementi del file che devono essere ripuliti, caratteri che appaiono come immondizia se il file viene aperto come utf-8 (ad esempio virgolette intelligenti e ellissi).
Sto pensando che forzare una conversione di codifica di testo può aiutare a eliminare tutti i caratteri non utf8 nel file. Tuttavia, non riesco a vedere come "sed" possa facilmente convertire la codifica del testo.
Avrò già salvato il file temp txt, come MacRoman, su disco usando le routine AppleScript integrate.
Qualcuno di voi ha qualche idea su uno strumento da riga di comando integrato in grado di convertire la codifica del testo? Riga di comando per prestazioni e built-in, poiché altri utenti del mio script non avranno necessariamente il set di strumenti adeguato se non è incorporato.
Grazie per l'aiuto!