Un mio peeve pet sta guardando così tanti progetti software che hanno montagne di codice per il supporto del set di caratteri. Non fraintendetemi, sono tutto per compatibilità e sono felice che gli editor di testo ti consentano di aprire e salvare file in più set di caratteri. Ciò che mi dà fastidio è come la proliferazione di codifiche di caratteri non universali sia etichettata come "supporto Unicode adeguato" piuttosto che "un problema".
Ad esempio, lasciami scegliere PostgreSQL e il suo supporto per i set di caratteri . PostgreSQL si occupa di due tipi di codifica:
- Codifica client: utilizzata nella comunicazione tra client e server.
- Codifica server: utilizzata per archiviare il testo internamente nel database.
Capisco perché supportare molte codifiche client sia una buona cosa. Consente ai client che non operano in UTF-8 di comunicare con PostgreSQL senza che debbano eseguire la conversione. Quello che non capisco è: perché PostgreSQL supporta codifiche di più server ? I file di database sono (quasi sempre) incompatibili da una versione PostgreSQL alla successiva, quindi la compatibilità tra versioni non è il problema qui.
UTF-8 è l'unico set di caratteri standard compatibile ASCII in grado di codificare tutti i punti di codice Unicode (se sbaglio, fammi sapere). Sono nel campo che UTF-8 è il miglior set di caratteri, ma sono disposto a sopportare altri set di caratteri universali come UTF-16 e UTF-32.
Credo che tutti i set di caratteri non universali dovrebbero essere deprecati. C'è qualche motivo convincente che non dovrebbero?