Nel 2010, potresti pubblicare URL contenenti caratteri UTF-8 in un portale Web di grandi dimensioni?
I caratteri Unicode sono vietati come da RFC sugli URL (vedi qui ). Dovrebbero essere codificati in percentuale per essere conformi agli standard.
Il mio punto principale, tuttavia, è servire i caratteri non codificati al solo scopo di avere URL di bell'aspetto, quindi la codifica percentuale è fuori.
Tutti i principali browser sembrano analizzare bene quegli URL, indipendentemente da ciò che dice la RFC. La mia impressione generale, tuttavia, è che diventa molto traballante quando si lascia il dominio dei browser Web:
- Gli URL vengono copiati + incollati in file di testo, e-mail e persino siti Web con una codifica diversa
- Librerie client HTTP
- Browser esotici, lettori RSS
La mia impressione è corretta che ci si aspetta un problema qui, e quindi non è (ancora) una soluzione pratica se stai servendo un pubblico non tecnico ed è importante che tutti i tuoi collegamenti funzionino correttamente anche se citati e trasmessi?
Esiste un modo magico di pubblicare URL di bell'aspetto in HTML
http://www.example.com/düsseldorf?neighbourhood=Lörick
che può essere copiato + incollato con i caratteri speciali intatti, ma funziona correttamente quando riutilizzato nei client più vecchi?