Unicode è inteso come un set di caratteri universale per descrivere tutti i caratteri richiesti per il testo scritto che incorpora tutti i sistemi di scrittura, i simboli tecnici e la punteggiatura.
Farò una domanda probabilmente controversa: "Una delle codifiche più popolari, UTF-16, dovrebbe essere considerata dannosa?" Perché faccio questa domanda? Quanti programmatori sono consapevoli del fatto che UTF-16 è in realtà una codifica a lunghezza variabile? Con questo intendo dire che ci sono punti di codice che, rappresentati come coppie surrogate, …
Nel caso in cui si verificasse un'invasione aliena e siamo stati costretti a supportare le loro lingue in tutti i nostri sistemi informatici esistenti, UTF-8 è progettato in modo da consentire la loro immensa quantità di personaggi? (Certo, non sappiamo se gli alieni abbiano effettivamente delle lingue, se o come …
Di recente ho provato a implementare un algoritmo di classificazione, AllegSkill, su Python 3. Ecco come appare la matematica: No davvero. Questo è quindi quello che ho scritto: t = (µw-µl)/c # those are used in e = ε/c # multiple places. σw_new = (σw**2 * (1 - (σw**2)/(c**2)*Wwin(t, e)) …
Ho pensato che Unicode fosse progettato per aggirare l'intero problema di avere molte codifiche diverse a causa di un piccolo spazio di indirizzi (8 bit) nella maggior parte dei tentativi precedenti (ASCII, ecc.). Perché allora ci sono così tante codifiche Unicode? Anche più versioni di (essenzialmente) la stessa, come UTF-8, …
Il nostro software line-of-business consente all'utente di salvare determinati dati come CSV . Dato che ci sono molti formati diversi (tutti chiamati "CSV") in uso in natura, stiamo cercando di decidere quale dovrebbe essere il "formato predefinito". Per quanto riguarda i separatori di linea / campo e la fuga, esiste …
I Termini di utilizzo Unicode stabiliscono che qualsiasi software che utilizza i propri file di dati (o una loro modifica) deve riportare i riferimenti di licenza Unicode. Mi sembra che la maggior parte delle librerie Unicode abbiano funzioni per verificare se un carattere è una cifra, una lettera, un simbolo, …
Sto imparando T-SQL. Dagli esempi che ho visto, per inserire del testo in una varchar()cella, posso scrivere solo la stringa da inserire, ma per le nvarchar()celle, ogni esempio ha come prefisso le stringhe con la lettera N. Ho provato la seguente query su una tabella che ha nvarchar()righe e funziona …
Un mio peeve pet sta guardando così tanti progetti software che hanno montagne di codice per il supporto del set di caratteri. Non fraintendetemi, sono tutto per compatibilità e sono felice che gli editor di testo ti consentano di aprire e salvare file in più set di caratteri. Ciò che …
Immagino che il motivo sia stato veloce, come una matrice come l'accesso al personaggio all'indice, ma alcuni caratteri non si adattano a 16 bit, quindi non funzionerebbe ... Quindi, se devi comunque gestire casi speciali, perché non usare solo UTF-8?
Al lavoro mi imbatto in molti file di testo giapponesi in Shift-JIS e altre codifiche. Causa molti problemi di mojibake (carattere illeggibile) per tutti gli utenti di computer. Unicode intendeva risolvere questo tipo di problema definendo un singolo set di caratteri per tutte le lingue e la serializzazione UTF-8 è …
Tutti sanno che PHP ha problemi con Unicode. La versione 6 viene effettivamente abbandonata, a causa delle difficoltà di implementazione Unicode. Ma mi chiedo se qualcuno sa quali sono i motivi esatti ? Problemi di architettura / design, problemi di prestazioni, problemi di comunità (non scommetto), qualcos'altro?
Stavo solo guardando la presentazione di Jon Skeet (con Tony the Pony) di Dev-Days. Sebbene "scrivere una funzione di inversione di stringa" stia codificando l'intervista 101 - Non sono sicuro che sia effettivamente possibile scrivere una funzione di inversione di stringa generale, certamente non una che funzioni in tutte le …
UTF-16 è a larghezza fissa o a larghezza variabile? Ho ottenuto risultati diversi da diverse fonti: Da http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 memorizza i caratteri Unicode in blocchi di sedici bit. Da http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (Unicode Transformation Format a 16 bit) è una codifica di caratteri per Unicode in grado di codificare …
Sto progettando un formato di file e voglio farlo nel modo giusto. Poiché si tratta di un formato binario, il primo byte (o byte) del file non dovrebbe formare caratteri testuali validi (proprio come nell'intestazione del file PNG 1 ). Ciò consente agli strumenti che non riconoscono il formato di …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.