Unicode è uno standard per la codifica, la rappresentazione e la gestione del testo con l'intenzione di supportare tutti i caratteri richiesti per il testo scritto che incorpora tutti i sistemi di scrittura, simboli tecnici e punteggiatura.
Ho provato a usare java.io.FileReader per leggere alcuni file di testo e convertirli in una stringa, ma ho scoperto che il risultato è codificato erroneamente e non è affatto leggibile. Ecco il mio ambiente: Windows 2003, codifica del sistema operativo: CP1252 Java 5.0 I miei file sono codificati UTF-8 o …
Il problema è che, come sai, ci sono migliaia di caratteri nel grafico Unicode e voglio convertire tutti i caratteri simili in lettere che sono in alfabeto inglese. Ad esempio, ecco alcune conversioni: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... e ho visto che ci sono …
Il progetto ICU (che ora ha anche una libreria PHP ) contiene le classi necessarie per aiutare a normalizzare le stringhe UTF-8 per facilitare il confronto dei valori durante la ricerca. Tuttavia, sto cercando di capire cosa significhi per le applicazioni. Ad esempio, in quali casi desidero "Equivalenza canonica" anziché …
Voglio qualcosa di simile 0x2022 8226 BULLET • Ma più grande. Non riesco nemmeno a trovarli http://www.ssec.wisc.edu/~tomw/java/unicode.html Cosa dovrei cercare? Dots? proiettili?
Cosa significa il codice carattere (HTML) &#8203;? L'ho trovato in uno dei miei script jQuery e mi chiedevo cosa fosse .. Grazie. Modificare: Ecco lo script in cui si trovava (è stato aggiunto alla fine, l'ho trovato in Firebug) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { …
Molte implementazioni regex moderne interpretano la \wscorciatoia della classe di caratteri come "qualsiasi lettera, cifra o punteggiatura di collegamento" (di solito: trattino basso). In questo modo, una regex come \w+partite parole come hello, élève, GOÄ_432o gefräßig. Sfortunatamente, Java no. In Java, \wè limitato a [A-Za-z0-9_]. Questo rende difficile trovare parole …
Sono veramente confuso. Ho provato a codificare ma l'errore ha detto can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) So come evitare l'errore con il prefisso "u" sulla stringa. …
Sto trovando Unicode per caratteri speciali dalla ricerca di FileFormat.Info . Alcuni caratteri vengono visualizzati come i classici glifi in bianco e nero, come ⚠ (segnale di avvertimento \u26A0o &#x26a0;). Questi sono preferibili, poiché posso applicare loro stili CSS (come il colore). Altri vengono visualizzati come emoji a fumetti più …
Nessuno dei seguenti codici funziona: p:before { content: " "; } p:before { content: "&nbsp;"; } Come aggiungo uno spazio bianco prima del contenuto dell'elemento? Nota: devo colorare il bordo sinistro e il margine sinistro per uso semantico e utilizzare lo spazio come margine incolore. :)
Voglio visualizzare un carattere Unicode in Java. Se lo faccio, funziona perfettamente: String symbol = "\u2202"; il simbolo è uguale a "∂". È quello che voglio. Il problema è che conosco il numero Unicode e da quello devo creare il simbolo Unicode. Ho provato (per me) la cosa ovvia: int …
Sto cercando di scrivere uno script Perl usando il pragma "utf8" e ottengo risultati inaspettati. Sto usando Mac OS X 10.5 (Leopard) e sto modificando con TextMate. Tutte le mie impostazioni sia per il mio editor che per il sistema operativo sono predefinite per scrivere file in formato utf-8. Tuttavia, …
Lo standard Unicode ha un numero sufficiente di punti di codice da richiedere 4 byte per memorizzarli tutti. Questo è ciò che fa la codifica UTF-32. Eppure la codifica UTF-8 in qualche modo li comprime in spazi molto più piccoli usando qualcosa chiamato "codifica a larghezza variabile". In effetti, riesce …
Chiuso . Questa domanda deve essere più mirata . Attualmente non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 6 anni fa . Migliora questa domanda Nella tua esperienza quali caratteri Unicode, punti di codice, …
Conosco lo schema% uxxxx non standard ma non mi sembra una scelta saggia poiché lo schema è stato rifiutato dal W3C. Alcuni esempi interessanti: Il carattere del cuore. Se lo digito nel mio browser: http://www.google.com/search?q=♥ Quindi copialo e incollalo, vedo questo URL http://www.google.com/search?q=%E2%99%A5 il che fa sembrare che Firefox (o …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.