RFC 3066 fornisce i dettagli dei valori consentiti (enfasi e collegamenti aggiunti):
Tutti i sottotag di 2 lettere vengono interpretati come codici paese ISO 3166 alpha-2 da [ISO 3166] , o successivamente assegnati dall'agenzia di manutenzione ISO 3166 o dagli organismi di normalizzazione governativi, che denotano l'area a cui si riferisce questa variante linguistica.
Lo interpreto nel senso che qualsiasi codice di due lettere valido (secondo ISO 3166) è valido come sottotag. La RFC prosegue affermando:
I tag con secondi sottotag da 3 a 8 lettere possono essere registrati con IANA, secondo le regole nel capitolo 5 di questo documento.
A proposito, sembra un errore di battitura, dato che il capitolo 3 sembra riguardare il processo di registrazione, non il capitolo 5.
Una rapida ricerca nel registro IANA rivela un elenco molto lungo , di tutti i sottotag di lingua disponibili. Ecco un esempio dall'elenco (che verrebbe utilizzato come en-scouse
):
Tipo: variante
Sottotag: scouse
Descrizione: Scouse
Aggiunto: 2006-09-18
Prefisso: en
Commenti: dialetto inglese Liverpudlian noto come 'Scouse'
Sono disponibili tutti i tipi di sottotag; ha già rivelato un rapido scorrimento fr-1694acad
(francese del XVII secolo).
L'utilità di alcuni di questi (direi la stragrande maggioranza di questi) tag, quando si tratta di documenti progettati per la visualizzazione nel browser, è limitata. La specifica di internazionalizzazione del W3C afferma semplicemente:
I browser e altre applicazioni possono utilizzare le informazioni sulla lingua del contenuto per fornire agli utenti le informazioni più appropriate o per presentare le informazioni agli utenti nel modo più appropriato. Maggiore è il numero di contenuti contrassegnati e contrassegnati correttamente, più tali applicazioni diventeranno utili e pervasive.
Faccio fatica a trovare informazioni dettagliate su come si comportano i browser quando incontrano tag di lingua diversi, ma molto probabilmente offriranno qualche vantaggio a quegli utenti che utilizzano uno screen reader, che può utilizzare il tag per determinare la lingua / dialetto / accento in cui presentare il contenuto.