Sto lavorando a un sito Web che offrirà contenuti localizzati seguendo l' language+regionapproccio descritto in questa pagina di W3.org (ad es. fr-CAPer il contenuto in francese canadese e fr-FRper il contenuto "francese francese"). Poiché consideriamo i contenuti per ognuno language+regiondi essi unici, per noi è fondamentale che i motori di ricerca identificino e servano adeguatamente i contenuti di conseguenza.
Cercando su Internet (ad esempio questa domanda ), sembra che la maggior parte delle persone raccomandino l'uso di un codice ISO639 nella lingua nell'attributo HTML langper descrivere la lingua del contenuto. Seguendo questa raccomandazione, utilizzeremmo <html lang="fr">che non consentirebbe la differenziazione tra le language+regioncombinazioni di cui sopra .
Quando si rivede la specifica HTML4 , sembra che l'utilizzo language+regioncome codice di lingua sia perfettamente OK, poiché l' en-USesempio è dato come un possibile valore. Tuttavia non sono riuscito a trovare alcuna conferma di ciò nella specifica HTML5 che non sembra fornire alcun esempio in merito ai possibili valori consentiti.
Da lì ho cercato di ottenere una risposta di fatto osservando cosa stanno facendo i giganti del web. Ho osservato cosa stanno facendo Facebook: offrono versioni candian francesi e francesi francesi dei loro siti Web con contenuti (leggermente) diversi, mentre il langvalore HTML rimane lo stesso:
URL fr-CA : http://fr-ca.facebook.com
Attributo lang HTML: <html lang="fr">
traduzione della parola "email":courriel
URL fr-FR : http://fr-fr.facebook.com/
Attributo lang HTML: <html lang="fr">
traduzione della parola "email":Adresse électronique
Qual è il modo raccomandato / standard per descrivere il contenuto che è stato localizzato usando l' language+regionapproccio in HTML5?