Sto lavorando a un sito Web che offrirà contenuti localizzati seguendo l' language+region
approccio descritto in questa pagina di W3.org (ad es. fr-CA
Per il contenuto in francese canadese e fr-FR
per il contenuto "francese francese"). Poiché consideriamo i contenuti per ognuno language+region
di essi unici, per noi è fondamentale che i motori di ricerca identificino e servano adeguatamente i contenuti di conseguenza.
Cercando su Internet (ad esempio questa domanda ), sembra che la maggior parte delle persone raccomandino l'uso di un codice ISO639 nella lingua nell'attributo HTML lang
per descrivere la lingua del contenuto. Seguendo questa raccomandazione, utilizzeremmo <html lang="fr">
che non consentirebbe la differenziazione tra le language+region
combinazioni di cui sopra .
Quando si rivede la specifica HTML4 , sembra che l'utilizzo language+region
come codice di lingua sia perfettamente OK, poiché l' en-US
esempio è dato come un possibile valore. Tuttavia non sono riuscito a trovare alcuna conferma di ciò nella specifica HTML5 che non sembra fornire alcun esempio in merito ai possibili valori consentiti.
Da lì ho cercato di ottenere una risposta di fatto osservando cosa stanno facendo i giganti del web. Ho osservato cosa stanno facendo Facebook: offrono versioni candian francesi e francesi francesi dei loro siti Web con contenuti (leggermente) diversi, mentre il lang
valore HTML rimane lo stesso:
URL fr-CA : http://fr-ca.facebook.com
Attributo lang HTML: <html lang="fr">
traduzione della parola "email":courriel
URL fr-FR : http://fr-fr.facebook.com/
Attributo lang HTML: <html lang="fr">
traduzione della parola "email":Adresse électronique
Qual è il modo raccomandato / standard per descrivere il contenuto che è stato localizzato usando l' language+region
approccio in HTML5?