La codifica dei caratteri si riferisce al modo in cui i caratteri sono rappresentati come una serie di byte. La codifica dei caratteri per il Web è definita nello standard di codifica.
Devo mantenere un gran numero di pagine ASP classiche, molte delle quali hanno dati tabulari senza capacità di ordinamento. Qualunque ordine lo sviluppatore originale abbia utilizzato nella query del database è ciò con cui sei bloccato. Voglio concentrarmi su alcuni ordinamenti di base su un mucchio di queste pagine e …
In Java, ho una stringa e voglio codificarla come array di byte (in UTF8 o qualche altra codifica). In alternativa, ho un array di byte (in alcune codifiche conosciute) e voglio convertirlo in una stringa Java. Come posso fare queste conversioni?
Sto estraendo i dati da un documento Google, elaborandoli e scrivendoli in un file (che alla fine incollerò in una pagina di Wordpress). Ha alcuni simboli non ASCII. Come posso convertirli in modo sicuro in simboli che possono essere utilizzati nel sorgente HTML? Attualmente sto convertendo tutto in Unicode mentre …
Vorrei aggiungere il teschio e le tibie incrociate Unicode al mio prompt della shell (in particolare "SKULL AND CROSSBONES" (U + 2620)), ma non riesco a capire l'incantesimo magico per far risuonare l'eco, o qualsiasi altro, Carattere Unicode a 4 cifre. Uno a due cifre è facile. Ad esempio, echo …
Qual era l'uso storico originale del carattere di tabulazione verticale ( \vin linguaggio C, ASCII 11)? Ha mai avuto un tasto su una tastiera? Come lo ha generato qualcuno? Esiste un linguaggio o un sistema ancora in uso oggi in cui il carattere di tabulazione verticale fa qualcosa di interessante …
Ecco il mio codice, for line in open('u.item'): #read each line ogni volta che eseguo questo codice dà il seguente errore: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte Ho provato a risolvere questo problema e ho aggiunto un parametro aggiuntivo in open (), il …
I problemi dei set di caratteri sono confusi e complicati da soli, ma soprattutto devi ricordare i nomi esatti dei tuoi set di caratteri. È vero "utf8"? Oppure "utf-8"? O forse "UTF-8"? Durante la ricerca di esempi di codice in Internet vedrai tutto quanto sopra. Perché non solo farli nominare …
Sto usando un &simbolo ' ' con HTML5 e UTF-8 nel mio sito <title>. Google mostra la e commerciale bene sui suoi SERP, così come tutti i browser nei loro titoli. http://validator.w3.org mi sta dando questo: e non ha iniziato un riferimento al personaggio. (e probabilmente avrebbe dovuto essere evaso …
Sto cercando di analizzare un po 'di HTML usando DOMDocument, ma quando lo faccio, improvvisamente perdo la mia codifica (almeno così mi sembra). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Il risultato di questo codice è …
Non sono mai stato sicuro di aver compreso la differenza tra decodifica / codifica str / unicode. So che str().decode()è per quando hai una stringa di byte che sai che ha una certa codifica dei caratteri, dato che il nome della codifica restituirà una stringa unicode. So che unicode().encode()converte i …
Il mio codice semplicemente raschia una pagina Web, quindi la converte in Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Ma ottengo un UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position …
Ho visto queste istruzioni come la prima riga di numerosi file CSS che mi sono stati consegnati: @charset "UTF-8"; Cosa fa ed è necessaria questa regola? Inoltre, se includo questo meta tag nel mio elemento "head", ciò eliminerebbe la necessità di averlo presente anche nei miei file CSS? <meta http-equiv="Content-Type" …
Sono confuso riguardo alla codifica e al set di caratteri del testo. Per molte ragioni, devo imparare cose non Unicode, non UTF8 nel mio prossimo lavoro. Trovo la parola "set di caratteri" nelle intestazioni delle e-mail come in "ISO-2022-JP", ma non esiste una tale codifica negli editor di testo. (Ho …
Ho un'applicazione che si occupa di client da tutto il mondo e, naturalmente, voglio che tutto ciò che va nei miei database sia codificato UTF-8. Il problema principale per me è che non so quale sarà la codifica dell'origine di qualsiasi stringa: potrebbe provenire da una casella di testo (l'utilizzo …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.