Generale
Questi caratteri non sono intesi per il normale testo in alfabeto latino ma per la fonetica, il testo in alfabeto cirillico, da utilizzare come simboli matematici (che rappresentano variabili) o simili. L'unico modo conforme a Unicode per codificare il testo nell'alfabeto latino di base consiste nell'utilizzare i caratteri utilizzati principalmente per questo scopo (ovvero, dal blocco Unicode latino di base ).
Come con molti altri standard, dovresti pensare due volte alla violazione di Unicode. Inoltre, Unicode comprende così tanti sistemi di scrittura, casi d'uso e cose che esistono solo per la retrocompatibilità con altri standard 1 che la piena comprensione di tutte le sue motivazioni è una scienza a sé stante. Per farla breve, a meno che tu non sappia davvero cosa stai facendo, è estremamente probabile che si rompa qualcosa a cui non hai nemmeno pensato a distanza.
Esempi specifici
Accessibilità
Il testo codificato non esiste solo per il rendering in alcuni caratteri. Può anche essere interpretato, ad esempio, dagli screen reader. E uno screen reader non dovrebbe aver bisogno di indovinare se
𝓽𝓱𝓮
è pensato per essere l'articolo determinativo o il prodotto matematico 2 delle variabili 𝓽, 𝓱 e 𝓮 - che è ciò per cui sono fatti quei personaggi. Il comportamento migliore sarà quindi quello di precisare questi personaggi, ad esempio dicendo letteralmente quanto segue:
grassetto piccolo t, grassetto piccolo h, grassetto piccolo e
Non dovrebbe semplicemente dire "il" invece perché non legge correttamente i testi matematici i cui simboli capita di formare una parola pronunciabile. 3
portabilità
Se il tuo testo è ben riprodotto sulla tua macchina, questo non significa che sarà anche su quello del lettore. L'esempio più ovvio è che il lettore non ha alcun carattere che supporti questi caratteri o che il testo sia reso da un software che non supporta i caratteri di fallback. Certo, questo sta diventando sempre meno comune. Tieni presente, tuttavia, che alcune persone come i dislessici hanno bisogno di caratteri speciali che hanno meno probabilità di supportare questi personaggi.
Ma anche se la macchina del lettore utilizza solo un carattere diverso, ciò potrebbe rendere il testo notevolmente meno leggibile. Per un primo esempio , questo è 𝓉𝒽ℯ reso con due diversi caratteri:
Free Serif esegue il rendering del testo come probabilmente si vorrebbe che fosse reso quando si usano caratteri speciali per simulare il testo, vale a dire simulare la scrittura a mano con un tratto continuo. Tuttavia, questi personaggi sono fatti per essere usati come simboli matematici, un collegamento che non ha senso. Quindi il rendering di STIX , che è specificamente progettato per scopi matematici, è più in linea con il modo in cui questi personaggi devono essere usati.
In un secondo esempio , supponiamo che tu o il lettore sia in corsivo "сᴜт мy вᴀʀ" per qualche motivo. Con un buon carattere, otterrai 4 :
La ragione di ciò è che le maiuscolette sono state (parzialmente) simulate con lettere cirilliche e il corsivo cirillico a volte sembra molto diverso dalle loro controparti verticali . Quindi, di nuovo, questo è il comportamento corretto.
ricercabilità
Come primo esempio, considera cosa vorresti fare una ricerca ragionevole con il personaggio 𝒲 (script matematico W ). Supponiamo che la ricerca abbia due modalità, la modalità predefinita e la modalità esatta (generalmente chiamata maiuscole e minuscole ). Questo personaggio dovrebbe essere:
trovato durante la ricerca di w o W in modalità predefinita - per coloro che non vogliono preoccuparsi di inserire o copiare e incollare il carattere speciale nel campo di ricerca;
trovato durante la ricerca di 𝒲 nella modalità esatta - per coloro che vogliono cercare dove la variabile corrispondente è menzionata in un documento matematico³;
non trovato durante la ricerca di 𝓌, w o W in modalità esatta a causa dell'interruzione di una ricerca simile alla precedente.
Tuttavia, se si utilizza questo carattere per simulare un testo normale, dovrebbe essere trovato durante la ricerca di W o 𝒲 nella modalità esatta, che è in conflitto con quanto sopra.
Come secondo esempio, considera che i caratteri cirillici non dovrebbero mai essere trovati durante la ricerca di caratteri latini e viceversa, poiché sono cose completamente diverse. Tuttavia, se si utilizzano caratteri cirillici per simulare caratteri maiuscoli latini, è necessario che ciò accada, se non si desidera interrompere la ricerca. Ciò porterebbe le persone a trovare un sacco di cose inutili se cercano una rara parola in alfabeto latino che in tal modo corrisponde ai finti maiuscoletti di alcune parole popolari in alfabeto cirillico (e viceversa).
Un'opzione di ricerca esatta non può risolvere questo problema, poiché è riservata ad altri scopi in quegli alfabeti.
In generale , è impossibile costruire una ricerca (senza una folle quantità di opzioni) che non viene interrotta usando caratteri speciali per simulare un testo latino in stile.
1 Sai che XKCD sull'inevitabile fallimento degli standard unificanti ? Bene, Unicode è riuscito.
2 o qualunque sia l'operatore vuoto nella pertinente convenzione
3 Sono consapevole che al giorno d'oggi pochissimi testi matematici supportano questa codifica o qualcosa di compatibile, ma il punto è che un giorno si spera. Il tuo testo che abusa di Unicode potrebbe essere ancora presente e letto.
4 A meno che tu non stia localizzando per macedone o serbo, in cui otterrai risultati diversi ma comunque indesiderabili.