UTF-8 è una codifica dei caratteri che descrive ciascun punto di codice Unicode utilizzando una sequenza di byte da uno a quattro byte. È retrocompatibile con ASCII pur supportando la rappresentazione di tutti i punti di codice Unicode.
Conosco lo schema% uxxxx non standard ma non mi sembra una scelta saggia poiché lo schema è stato rifiutato dal W3C. Alcuni esempi interessanti: Il carattere del cuore. Se lo digito nel mio browser: http://www.google.com/search?q=♥ Quindi copialo e incollalo, vedo questo URL http://www.google.com/search?q=%E2%99%A5 il che fa sembrare che Firefox (o …
Sto tentando di lavorare con un set di dati molto grande che contiene alcuni caratteri non standard. Devo usare Unicode, secondo le specifiche del lavoro, ma sono sconcertato. (E molto probabilmente sbagliando tutto.) Apro il CSV utilizzando: 15 ncesReader = csv.reader(open('geocoded_output.csv', 'rb'), delimiter='\t', quotechar='"') Quindi, provo a codificarlo con: name=school_name.encode('utf-8'), …
Sto riscontrando alcuni problemi nel tentativo di codificare una stringa in UTF-8. Ho provato numerose cose, incluso l'uso di string.encode('utf-8')e unicode(string), ma ottengo l'errore: UnicodeDecodeError: il codec 'ascii' non può decodificare il byte 0xef nella posizione 1: ordinale non compreso nell'intervallo (128) Questa è la mia stringa: (。・ω・。)ノ Non vedo …
Sto usando la window.atob()funzione Javascript per decodificare una stringa con codifica base64 (in particolare il contenuto con codifica base64 dall'API GitHub). Il problema è che sto recuperando i caratteri con codifica ASCII (come â¢invece di ™). Come posso gestire correttamente il flusso in entrata con codifica base64 in modo che …
Ho cercato su Google questo argomento e ho esaminato ogni risposta, ma ancora non riesco a capirlo. Fondamentalmente ho bisogno di convertire la stringa UTF-8 in ISO-8859-1 e lo faccio usando il seguente codice: Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; string msg = iso.GetString(utf8.GetBytes(Message)); La mia stringa di …
Una delle risposte a una domanda che ho posto ieri mi ha suggerito di assicurarmi che il mio database possa gestire correttamente i caratteri UTF-8. Come posso farlo con MySQL?
Le mie categorie devono essere denominate con lettere greche. Sto usando ggplot2e funziona magnificamente con i dati. Purtroppo non riesco a capire come mettere quei simboli greci sull'asse x (presso i segni di graduazione) e farli apparire anche nella legenda. C'è modo di farlo? AGGIORNAMENTO: Ho dato un'occhiata al collegamento …
Attualmente sto cercando un modo semplice per serializzare gli oggetti (in C # 3). Ho cercato su Google alcuni esempi e ho trovato qualcosa come: MemoryStream memoryStream = new MemoryStream ( ); XmlSerializer xs = new XmlSerializer ( typeof ( MyObject) ); XmlTextWriter xmlTextWriter = new XmlTextWriter ( memoryStream, Encoding.UTF8 …
Esiste una funzione in PHP che può decodificare sequenze di escape Unicode come " \u00ed" in " í" e tutte le altre occorrenze simili? Ho trovato una domanda simile qui ma non sembra funzionare.
Se UTF-8 è di 8 bit, non significa che ci può essere solo un massimo di 256 caratteri diversi? I primi 128 punti di codice sono gli stessi di ASCII. Ma dice che UTF-8 può supportare fino a milioni di caratteri? Come funziona?
Sto cercando di leggere da un text/plainfile su Internet, riga per riga. Il codice che ho in questo momento è: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new LinkedList(); String readLine; while ((readLine = in.readLine()) != null) { lines.add(readLine); } for (String line …
Sto testando il modo in cui alcuni dei miei codici gestiscono dati non validi e ho bisogno di alcune serie di byte che non sono UTF-8 non validi. Puoi pubblicare alcuni, e idealmente, una spiegazione del perché sono cattivi / dove li hai presi?
Per scopi di debug, è necessario cercare in modo ricorsivo una directory per tutti i file che iniziano con un contrassegno di ordine di byte (BOM) UTF-8. La mia soluzione attuale è un semplice script di shell: find -type f | while read file do if [ "`head -c 3 …
Sto cercando di leggere un file CSV con caratteri accentati con Python (solo caratteri francesi e / o spagnoli). Sulla base della documentazione di Python 2.5 per csvreader ( http://docs.python.org/library/csv.html ), ho trovato il seguente codice per leggere il file CSV poiché csvreader supporta solo ASCII. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): …
Quando apro un file in Sublime Text 3, in basso ho un'opzione per impostare la codifica dei caratteri come mostrato nello screenshot. C'è la possibilità di impostarlo su UTF-8 , che dopo aver fatto qualche ricerca significa UTF-8 senza BOM, ma voglio impostarlo su UTF-8 con BOM come mostrato di …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.