Unicode è uno standard per la codifica, la rappresentazione e la gestione del testo con l'intenzione di supportare tutti i caratteri richiesti per il testo scritto che incorpora tutti i sistemi di scrittura, simboli tecnici e punteggiatura.
Sto riscontrando alcuni problemi nel tentativo di codificare una stringa in UTF-8. Ho provato numerose cose, incluso l'uso di string.encode('utf-8')e unicode(string), ma ottengo l'errore: UnicodeDecodeError: il codec 'ascii' non può decodificare il byte 0xef nella posizione 1: ordinale non compreso nell'intervallo (128) Questa è la mia stringa: (。・ω・。)ノ Non vedo …
Ho un requisito relativamente oscuro, ma sembra che dovrebbe essere possibile utilizzare il BCL. Per contesto, sto analizzando una stringa data / ora in Noda Time . Mantengo un cursore logico per la mia posizione all'interno della stringa di input. Quindi, sebbene la stringa completa possa essere "3 gennaio 2013", …
Quindi lo so String#codePointAt(int), ma è indicizzato chardall'offset, non dall'offset del punto di codice. Sto pensando di provare qualcosa come: utilizzando String#charAt(int)per ottenere charun indice verificare se charè nella gamma di surrogati alti in tal caso, utilizzare String#codePointAt(int)per ottenere il punto di codice e incrementare l'indice di 2 in caso …
Come apparirebbe uno awkscript (presumibilmente un one-liner) per la rimozione di una distinta materiali ? Specifica: stampa ogni riga dopo la prima ( NR > 1) per la prima riga: se inizia con #FE #FFo #FF #FE, rimuovili e stampa il resto
Ho una stringa che sembra così: 6Â 918Â 417Â 712 Il modo chiaro per tagliare questa stringa (come ho capito Python) è semplicemente dire che la stringa si trova in una variabile chiamata s, otteniamo: s.replace('Â ', '') Questo dovrebbe fare il trucco. Ma ovviamente si lamenta del fatto che …
Sto leggendo e analizzando un file XML di Amazon e mentre il file XML mostra un ', quando provo a stamparlo ottengo il seguente errore: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) Da quello che ho letto online finora, l'errore deriva dal fatto che …
Nel mio codice JavaScript ho bisogno di comporre un messaggio al server in questo formato: <size in bytes>CRLF <data>CRLF Esempio: 3 foo I dati possono contenere caratteri Unicode. Devo inviarli come UTF-8. Sto cercando il modo più cross-browser per calcolare la lunghezza della stringa in byte in JavaScript. Ho provato …
Sto provando a farlo: <TextBlock Text="{Binding Path=Text, Converter={StaticResource stringFormatConverter}, ConverterParameter='&\u2014{0}'}" /> Per far apparire un - davanti al testo. Non funziona. Cosa dovrei fare qui?
In un file di testo, c'è una stringa "Non mi piace". Tuttavia, quando lo leggo in una stringa, diventa "Non \ xe2 \ x80 \ x98t in questo modo". Capisco che \ u2018 sia la rappresentazione Unicode di "'". Io uso f1 = open (file1, "r") text = f1.read() comando …
Secondo la documentazione di Apache Commons Lang per StringUtils.isNumeric(), la stringa "१२३" è numerica. Poiché credevo che questo potesse essere un errore nella documentazione, ho eseguito dei test per verificare l'istruzione. Ho scoperto che in base alla Apache Commons si è numerico. Perché questa stringa è numerica? Cosa rappresentano quei …
Abbiamo già ottenuto la nostra base di codice in esecuzione con Python 2.6. Per prepararci a Python 3.0, abbiamo iniziato ad aggiungere: from __future__ import unicode_literals nei nostri .pyfile (man mano che li modifichiamo). Mi chiedo se qualcun altro lo abbia fatto e si sia imbattuto in qualche trucco non …
Lavorando con Python 2.7, mi chiedo quale sia il vero vantaggio nell'usare il tipo unicodeinvece di str, poiché entrambi sembrano essere in grado di contenere stringhe Unicode. C'è qualche motivo speciale oltre alla possibilità di impostare i codici Unicode in unicodestringhe utilizzando il carattere di escape \?: Eseguire un modulo …
Le mie categorie devono essere denominate con lettere greche. Sto usando ggplot2e funziona magnificamente con i dati. Purtroppo non riesco a capire come mettere quei simboli greci sull'asse x (presso i segni di graduazione) e farli apparire anche nella legenda. C'è modo di farlo? AGGIORNAMENTO: Ho dato un'occhiata al collegamento …
Sto lavorando con un file .txt. Voglio una stringa di testo dal file senza caratteri non ASCII. Tuttavia, voglio lasciare spazi e periodi. Al momento sto spogliando anche quelli. Ecco il codice: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return char def get_my_string(file_path): f=open(file_path,'r') …
Eseguo questo frammento due volte, nel terminale Ubuntu (codifica impostata su utf-8), una volta con ./test.pye poi con ./test.py >out.txt: uni = u"\u001A\u0BC3\u1451\U0001D10C" print uni Senza reindirizzamento stampa spazzatura. Con il reindirizzamento ottengo un UnicodeDecodeError. Qualcuno può spiegare perché ricevo l'errore solo nel secondo caso, o ancora meglio dare una …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.