Domande taggate «unicode»

Unicode è uno standard per la codifica, la rappresentazione e la gestione del testo con l'intenzione di supportare tutti i caratteri richiesti per il testo scritto che incorpora tutti i sistemi di scrittura, simboli tecnici e punteggiatura.





12
UTF-8, UTF-16 e UTF-32
Quali sono le differenze tra UTF-8, UTF-16 e UTF-32? Comprendo che memorizzeranno tutti Unicode e che ciascuno utilizza un diverso numero di byte per rappresentare un personaggio. C'è un vantaggio nella scelta l'uno rispetto all'altro?
487 unicode  utf-8  utf-16  utf  utf-32 

12
Salvataggio di testi utf-8 in json.dumps come UTF8, non come sequenza di escape
codice di esempio: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" Il problema: non è leggibile dall'uomo. I miei utenti (intelligenti) vogliono verificare o persino modificare i file di testo con i dump JSON (e preferirei non utilizzare XML). C'è un modo per serializzare gli …
474 python  json  unicode  utf-8  escaping 

30
Il modo migliore per invertire una stringa
Ho appena dovuto scrivere una funzione di inversione di stringa in C # 2.0 (cioè LINQ non disponibile) e ho pensato a questo: public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length - 1; i > -1; i--) { reverse += …

18
UnicodeDecodeError durante la lettura del file CSV in Panda con Python
Sto eseguendo un programma che sta elaborando 30.000 file simili. Un numero casuale di questi si sta arrestando e producendo questo errore ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() …


9
Che cos'è Unicode, UTF-8, UTF-16?
Qual è la base per Unicode e perché è necessaria UTF-8 o UTF-16? Ho cercato questo su Google e cercato anche qui, ma non mi è chiaro. In VSS quando si fa un confronto di file, a volte c'è un messaggio che dice che i due file hanno UTF diversi. …

5
Perché 2+ 40 equivalgono a 42?
Ero sconcertato quando un collega mi ha mostrato questa riga di avviso JavaScript 42. alert(2+ 40); Esegui snippet di codiceNascondi risultatiEspandi frammento Si scopre rapidamente che quello che sembra un segno meno è in realtà un arcano personaggio Unicode con una semantica chiaramente diversa. Questo mi ha lasciato chiedendo perché …

11
Come posso grep per tutti i caratteri non ASCII?
Ho diversi file XML di grandi dimensioni e sto cercando di trovare le righe che contengono caratteri non ASCII. Ho provato quanto segue: grep -e "[\x{00FF}-\x{FFFF}]" file.xml Ma questo restituisce ogni riga nel file, indipendentemente dal fatto che la riga contenga un carattere nell'intervallo specificato. Ho la sintassi sbagliata o …
359 regex  unix  unicode  grep 


6
Come trovare la lunghezza di una stringa in R
Come trovare la lunghezza di una stringa (numero di caratteri in una stringa) senza dividerla in R? So come trovare la lunghezza di un elenco ma non di una stringa. E le stringhe Unicode? Come trovo la lunghezza (in byte) e il numero di caratteri (rune, simboli) in una stringa …

14
Unicode (UTF-8) che legge e scrive su file in Python
Sto riscontrando un fallimento del cervello nella comprensione della lettura e della scrittura di testo in un file (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print ss, …
330 python  unicode  utf-8  io 

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.