UTF-8 è una codifica dei caratteri che descrive ciascun punto di codice Unicode utilizzando una sequenza di byte da uno a quattro byte. È retrocompatibile con ASCII pur supportando la rappresentazione di tutti i punti di codice Unicode.
Sto riscontrando un fallimento del cervello nella comprensione della lettura e della scrittura di testo in un file (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print ss, …
Sto leggendo molti testi da vari feed RSS e li inserisco nel mio database. Ovviamente, ci sono diverse codifiche di caratteri utilizzate nei feed, ad esempio UTF-8 e ISO 8859-1. Sfortunatamente, a volte ci sono problemi con la codifica dei testi. Esempio: "Ss" in "Fußball" dovrebbe apparire così nel mio …
Sto cercando di capire quale raccolta dovrei usare per vari tipi di dati. Il 100% del contenuto che memorizzerò viene inviato dall'utente. La mia comprensione è che dovrei usare la CI generale UTF-8 (senza distinzione tra maiuscole e minuscole) invece della binaria UTF-8. Tuttavia, non riesco a trovare una chiara …
Devo usare UTF-8 nelle proprietà delle mie risorse usando Java ResourceBundle. Quando inserisco il testo direttamente nel file delle proprietà, viene visualizzato come mojibake. La mia app funziona su Google App Engine. Qualcuno può darmi un esempio? Non riesco a ottenere questo lavoro.
Out-File sembra forzare la distinta quando si utilizza UTF-8: $MyFile = Get-Content $MyPath $MyFile | Out-File -Encoding "UTF8" $MyPath Come posso scrivere un file in UTF-8 senza BOM usando PowerShell?
Ho trascorso un sacco di tempo per quanto sono principiante in Python. Come potrei mai decodificare un simile URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 a questo in Python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) sta restituendo qualcosa di molto brutto. Ancora nessuna soluzione, ogni aiuto è apprezzato.
Supponiamo che io abbia appena usato a BufferedInputStreamper leggere i byte di un file di testo codificato UTF-8 in un array di byte. So che posso usare la seguente routine per convertire i byte in una stringa, ma c'è un modo più efficiente / più intelligente di farlo che non …
Ecco come è impostata la mia connessione: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); E sto ricevendo il seguente errore quando tiro per aggiungere una riga a una tabella: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Sto inserendo migliaia di record e ottengo sempre …
Sto usando un &simbolo ' ' con HTML5 e UTF-8 nel mio sito <title>. Google mostra la e commerciale bene sui suoi SERP, così come tutti i browser nei loro titoli. http://validator.w3.org mi sta dando questo: e non ha iniziato un riferimento al personaggio. (e probabilmente avrebbe dovuto essere evaso …
Sono davvero confuso con il codecs.open function. Quando io faccio: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Mi dà l'errore UnicodeDecodeError: il codec 'ascii' non può decodificare il byte 0xef in posizione 0: ordinale non compreso nell'intervallo (128) Se lo faccio: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() Funziona bene La …
Ho un'app legacy che sta iniziando a comportarsi male, per qualsiasi motivo non ne sono sicuro. Genera un sacco di HTML che viene trasformato in report PDF da ActivePDF. Il processo funziona in questo modo: Estrai un modello HTML da un DB con token da sostituire (ad es. "~ CompanyName …
Sto cercando di analizzare un po 'di HTML usando DOMDocument, ma quando lo faccio, improvvisamente perdo la mia codifica (almeno così mi sembra). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Il risultato di questo codice è …
Ho un browser che invia caratteri utf-8 al mio server Python, ma quando lo recupero dalla stringa di query, la codifica che Python restituisce è ASCII. Come posso convertire la stringa semplice in utf-8? NOTA: la stringa passata dal web è già codificata UTF-8, voglio solo fare Python per trattarla …
Ho questa cosa molto semplice che produce solo alcune cose in formato CSV, ma deve essere UTF-8. Apro questo file in TextEdit o TextMate o Dreamweaver e visualizza correttamente i caratteri UTF-8, ma se lo apro in Excel fa invece questo stupido tipo di cosa. Ecco cosa ho in testa …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.