Domande taggate «unicode»

Unicode è uno standard per la codifica, la rappresentazione e la gestione del testo con l'intenzione di supportare tutti i caratteri richiesti per il testo scritto che incorpora tutti i sistemi di scrittura, simboli tecnici e punteggiatura.



6
SintassiErrore: carattere non ASCII '\ xa3' nel file quando la funzione restituisce '£'
Di 'che ho una funzione: def NewFunction(): return '£' Voglio stampare alcune cose con un cancelletto davanti e stampa un errore quando provo a eseguire questo programma, viene visualizzato questo messaggio di errore: SyntaxError: Non-ASCII character '\xa3' in file 'blah' but no encoding declared; see http://www.python.org/peps/pep-0263.html for details Qualcuno può …



4
Perché questo codice, scritto al contrario, stampa "Hello World!"
Ecco un po 'di codice che ho trovato su Internet: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H','e','l','l','o',' ','W','o','r','l','d','!'});}} Questo codice viene stampato Hello World!sullo schermo; puoi vederlo correre qui . Posso vedere chiaramente public static void mainscritto, ma è al contrario. Come funziona questo codice? Come si compila anche questo? …

9
UnicodeDecodeError, byte di continuazione non valido
Perché l'articolo sottostante non riesce? e perché ha successo con il codec "latin-1"? o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving v = o.decode("utf-8") risulta in: Traceback (most recent call last): File "<stdin>", line 1, in <module> …
257 python  unicode  decode 

7
Sostituisci caratteri non ASCII con un singolo spazio
Devo sostituire tutti i caratteri non ASCII (\ x00- \ x7F) con uno spazio. Sono sorpreso che questo non sia assolutamente facile in Python, a meno che non manchi qualcosa. La seguente funzione rimuove semplicemente tutti i caratteri non ASCII: def remove_non_ascii_1(text): return ''.join(i for i in text if ord(i)<128) …

13
Python: rimozione di \ xa0 dalla stringa?
Attualmente sto usando Beautiful Soup per analizzare un file HTML e chiamare get_text(), ma sembra che mi venga lasciato un sacco di \ xa0 Unicode che rappresentano gli spazi. Esiste un modo efficace per rimuoverli tutti in Python 2.7 e trasformarli in spazi? Immagino che la domanda più generalizzata sarebbe: …
241 python  parsing  unicode 

12
Quanti byte accetta un carattere Unicode?
Sono un po 'confuso riguardo alle codifiche. Per quanto ne so, i vecchi caratteri ASCII hanno preso un byte per carattere. Quanti byte richiede un carattere Unicode? Presumo che un carattere Unicode possa contenere tutti i caratteri possibili di qualsiasi lingua - ho ragione? Di quanti byte ha bisogno per …

5
Come posso modificare la codifica di un file con vim?
Sono abituato a usare vim per modificare le terminazioni di linea di un file: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators È possibile utilizzare un processo simile per modificare la codifica …
235 vim  unicode 

8
Scrivere testo Unicode in un file di testo?
Sto estraendo i dati da un documento Google, elaborandoli e scrivendoli in un file (che alla fine incollerò in una pagina di Wordpress). Ha alcuni simboli non ASCII. Come posso convertirli in modo sicuro in simboli che possono essere utilizzati nel sorgente HTML? Attualmente sto convertendo tutto in Unicode mentre …

5
Qual è la differenza tra _tmain () e main () in C ++?
Se eseguo la mia applicazione C ++ con il seguente metodo main () è tutto a posto: int main(int argc, char *argv[]) { cout << "There are " << argc << " arguments:" << endl; // Loop through each argument and print its number and value for (int i=0; i<argc; …
224 c++  unicode  arguments 


11
JavaScript + regex Unicode
Come posso usare le espressioni regolari compatibili con Unicode in JavaScript? Ad esempio, dovrebbe esserci qualcosa di simile a \wquello che può corrispondere a qualsiasi punto di codice nella categoria Lettere o Segni (non solo quelli ASCII) e, si spera, avere filtri come [[P *]] per la punteggiatura, ecc.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.