Programmazione utf-8

5

Qual è il modo corretto per codificare in URL i caratteri Unicode?

Conosco lo schema% uxxxx non standard ma non mi sembra una scelta saggia poiché lo schema è stato rifiutato dal W3C. Alcuni esempi interessanti: Il carattere del cuore. Se lo digito nel mio browser: http://www.google.com/search?q=♥ Quindi copialo e incollalo, vedo questo URL http://www.google.com/search?q=%E2%99%A5 il che fa sembrare che Firefox (o …

107 unicode utf-8 character-encoding urlencode web-standards

10

UnicodeDecodeError: il codec "ascii" non può decodificare il byte 0xd1 nella posizione 2: ordinale non compreso nell'intervallo (128)

Sto tentando di lavorare con un set di dati molto grande che contiene alcuni caratteri non standard. Devo usare Unicode, secondo le specifiche del lavoro, ma sono sconcertato. (E molto probabilmente sbagliando tutto.) Apro il CSV utilizzando: 15 ncesReader = csv.reader(open('geocoded_output.csv', 'rb'), delimiter='\t', quotechar='"') Quindi, provo a codificarlo con: name=school_name.encode('utf-8'), …

107 python django utf-8

16

UnicodeDecodeError: il codec 'ascii' non può decodificare il byte 0xef nella posizione 1

Sto riscontrando alcuni problemi nel tentativo di codificare una stringa in UTF-8. Ho provato numerose cose, incluso l'uso di string.encode('utf-8')e unicode(string), ma ottengo l'errore: UnicodeDecodeError: il codec 'ascii' non può decodificare il byte 0xef nella posizione 1: ordinale non compreso nell'intervallo (128) Questa è la mia stringa: (｡･ω･｡)ﾉ Non vedo …

106 python unicode utf-8

9

L'utilizzo dell'atob di Javascript per decodificare base64 non decodifica correttamente le stringhe utf-8

Sto usando la window.atob()funzione Javascript per decodificare una stringa con codifica base64 (in particolare il contenuto con codifica base64 dall'API GitHub). Il problema è che sto recuperando i caratteri con codifica ASCII (come â¢invece di ™). Come posso gestire correttamente il flusso in entrata con codifica base64 in modo che …

106 javascript encoding utf-8

8

C # Converte la stringa da UTF-8 a ISO-8859-1 (Latin1) H

Ho cercato su Google questo argomento e ho esaminato ogni risposta, ma ancora non riesco a capirlo. Fondamentalmente ho bisogno di convertire la stringa UTF-8 in ISO-8859-1 e lo faccio usando il seguente codice: Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; string msg = iso.GetString(utf8.GetBytes(Message)); La mia stringa di …

103 c# .net encoding utf-8 iso-8859-1

14

Come fare in modo che MySQL gestisca correttamente UTF-8

Una delle risposte a una domanda che ho posto ieri mi ha suggerito di assicurarmi che il mio database possa gestire correttamente i caratteri UTF-8. Come posso farlo con MySQL?

102 mysql utf-8

4

Come usare i simboli greci in ggplot2?

Le mie categorie devono essere denominate con lettere greche. Sto usando ggplot2e funziona magnificamente con i dati. Purtroppo non riesco a capire come mettere quei simboli greci sull'asse x (presso i segni di graduazione) e farli apparire anche nella legenda. C'è modo di farlo? AGGIORNAMENTO: Ho dato un'occhiata al collegamento …

101 r graphics unicode utf-8 ggplot2

6

Utilizzo di StringWriter per la serializzazione XML

Attualmente sto cercando un modo semplice per serializzare gli oggetti (in C # 3). Ho cercato su Google alcuni esempi e ho trovato qualcosa come: MemoryStream memoryStream = new MemoryStream ( ); XmlSerializer xs = new XmlSerializer ( typeof ( MyObject) ); XmlTextWriter xmlTextWriter = new XmlTextWriter ( memoryStream, Encoding.UTF8 …

99 c# sql-server xml utf-8 xml-serialization

7

Come decodificare le sequenze di escape Unicode come "\ u00ed" in caratteri codificati UTF-8 appropriati?

Esiste una funzione in PHP che può decodificare sequenze di escape Unicode come " \u00ed" in " í" e tutte le altre occorrenze simili? Ho trovato una domanda simile qui ma non sembra funzionare.

97 php unicode utf-8 escaping decoding

10

Quanti caratteri possono codificare UTF-8?

Se UTF-8 è di 8 bit, non significa che ci può essere solo un massimo di 256 caratteri diversi? I primi 128 punti di codice sono gli stessi di ASCII. Ma dice che UTF-8 può supportare fino a milioni di caratteri? Come funziona?

97 utf-8 character-encoding ascii

3

Leggere InputStream come UTF-8

Sto cercando di leggere da un text/plainfile su Internet, riga per riga. Il codice che ho in questo momento è: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new LinkedList(); String readLine; while ((readLine = in.readLine()) != null) { lines.add(readLine); } for (String line …

96 java utf-8 inputstream

5

Esempio di stringa utf8 non valida?

Sto testando il modo in cui alcuni dei miei codici gestiscono dati non validi e ho bisogno di alcune serie di byte che non sono UTF-8 non validi. Puoi pubblicare alcuni, e idealmente, una spiegazione del perché sono cattivi / dove li hai presi?

96 unit-testing utf-8

11

Un modo elegante per cercare file UTF-8 con BOM?

Per scopi di debug, è necessario cercare in modo ricorsivo una directory per tutti i file che iniziano con un contrassegno di ordine di byte (BOM) UTF-8. La mia soluzione attuale è un semplice script di shell: find -type f | while read file do if [ "`head -c 3 …

94 php utf-8 shell text-editor

9

Leggere un file CSV UTF8 con Python

Sto cercando di leggere un file CSV con caratteri accentati con Python (solo caratteri francesi e / o spagnoli). Sulla base della documentazione di Python 2.5 per csvreader ( http://docs.python.org/library/csv.html ), ho trovato il seguente codice per leggere il file CSV poiché csvreader supporta solo ASCII. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): …

93 python utf-8 csv character-encoding

4

Imposta la codifica del file su UTF8 con BOM in testo sublime 3

Quando apro un file in Sublime Text 3, in basso ho un'opzione per impostare la codifica dei caratteri come mostrato nello screenshot. C'è la possibilità di impostarlo su UTF-8 , che dopo aver fatto qualche ricerca significa UTF-8 senza BOM, ma voglio impostarlo su UTF-8 con BOM come mostrato di …

92 encoding utf-8 sublimetext3 sublimetext2 byte-order-mark

Domande taggate «utf-8»