Un altro motivo per scegliere quello breve è che corrisponde ad altri casi in cui è possibile specificare un set di caratteri nel markup. Per esempio:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
La coerenza aiuta a ridurre gli errori e a rendere il codice più leggibile.
Si noti che l'attributo charset non fa distinzione tra maiuscole e minuscole. Puoi usare UTF-8 o utf-8, tuttavia UTF-8 è più chiaro, più leggibile, più preciso.
Inoltre, non vi è assolutamente alcun motivo per utilizzare qualsiasi valore diverso da UTF-8 nell'attributo meta charset o nell'intestazione della pagina. UTF-8 è la codifica predefinita per i documenti Web da HTML4 nel 1999 e l'unico modo pratico per creare pagine Web moderne.
Inoltre non dovresti usare entità HTML in UTF-8. Personaggi come il simbolo del copyright devono essere digitati direttamente. Le uniche entità che dovresti usare sono per i 5 caratteri di markup riservati: minore di, maggiore di, e commerciale, primo, doppio primo. Le entità necessitano di un parser HTML, che potresti non voler sempre utilizzare in futuro, introducono errori, rendono il codice meno leggibile, aumentano le dimensioni del file e talvolta decodificano in modo errato in vari browser a seconda delle entità utilizzate. Scopri come digitare / inserire copyright, marchio commerciale, citazione aperta, citazione chiusa, apostrofo, trattino, trattino, pallottola, Euro e qualsiasi altro personaggio che incontri nei tuoi contenuti e come usare quei caratteri reali nel tuo codice. Il Mac ha un Visualizzatore caratteri che puoi attivare in Preferenze di Sistema tastiera, e puoi trovare e quindi trascinare e rilasciare i caratteri necessari o utilizzare il Visualizzatore tastiera corrispondente per vedere quali tasti digitare. Ad esempio, il marchio commerciale è Opzione + 2. UTF-8 contiene tutti i caratteri e i simboli di ogni linguaggio umano scritto. Quindi non ci sono scuse per l'uso, invece di un trattino. Non è una cattiva idea imparare anche le regole di punteggiatura e tipografia ... per esempio, sapendo che un punto va dentro una citazione stretta, non fuori.
L'uso di un tag per qualcosa di simile al tipo di contenuto e alla codifica è estremamente ironico, poiché senza conoscere queste cose, non è possibile analizzare il file per ottenere il valore del metatag.
No, questo non è vero. Il browser inizia ad analizzare il file come codifica predefinita del browser, UTF-8 o ISO-8859-1. Poiché US-ASCII è un sottoinsieme di ISO-8859-1 e UTF-8, il browser può leggere bene in entrambi i modi ... è lo stesso. Quando il browser rileva il tag meta charset, se la codifica è diversa da quella già utilizzata dal browser, il browser ricarica la pagina nella codifica specificata. Ecco perché mettiamo il tag meta charset in alto, subito dopo il tag head, prima di ogni altra cosa, persino il titolo. In questo modo puoi usare i caratteri UTF-8 nel tuo titolo.
È necessario salvare i file nella codifica UTF-8 senza distinta base
Questo non è strettamente vero. Se nel documento sono presenti solo caratteri US-ASCII, è possibile salvarlo come US-ASCII e servirlo come UTF-8, poiché è un sottoinsieme. Ma se ci sono caratteri Unicode, hai ragione, devi salvare come UTF-8 senza DBA.
Se vuoi un buon editor di testo che salverà i tuoi file in UTF-8, ti consiglio Notepad ++.
Sul Mac, usa Bare Bones TextWrangler (gratuito) dal Mac App Store o Bare Bones BBEdit, che si trova sul Mac App Store per $ 39,99 ... molto economico per uno strumento così eccezionale. In entrambe le app, c'è un menu nella parte inferiore della finestra del documento in cui si specifica la codifica del documento e si può facilmente scegliere "UTF-8 no BOM". E ovviamente puoi impostarlo come predefinito per i nuovi documenti in Preferenze.
Ma se il tuo server web serve la codifica nell'intestazione HTTP, che è raccomandato, entrambi i [meta tag] sono inutili.
Questo non è corretto Ovviamente dovresti impostare la codifica nell'intestazione HTTP, ma dovresti anche impostarla nell'attributo meta charset in modo che la pagina possa essere salvata dall'utente, fuori dal browser nella memoria locale e quindi riaperta più tardi, nel qual caso l'unica indicazione della codifica che sarà presente è l'attributo meta charset. Dovresti anche impostare un tag base per lo stesso motivo ... sul server, il tag base non è necessario, ma quando aperto dalla memoria locale, il tag base consente alla pagina di funzionare come se fosse sul server, con tutti i risorse in atto e così via, nessun collegamento interrotto.
AggiungiDefaultCharset UTF-8
Oppure puoi semplicemente modificare la codifica di determinati tipi di file in questo modo:
AddType text/html;charset=utf-8 html
Un suggerimento per servire sia i file UTF-8 che i file Latin-1 (ISO-8859-1) è quello di dare ai file UTF-8 un'estensione "text" e i file Latin-1 "txt".
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
Infine, considera la possibilità di salvare i tuoi documenti con terminazioni di linea Unix, non legacy DOS o terminazioni di linea (classiche) per Mac, che non aiutano e potrebbero danneggiare, specialmente lungo la linea man mano che andiamo sempre più lontano da quei sistemi legacy. Un documento HTML con HTML5 valido, codifica UTF-8 e terminazioni di riga Unix è un lavoro ben fatto. È possibile condividere e modificare e archiviare e leggere e recuperare e fare affidamento su quel documento in molti contesti. È lingua franca. È carta digitale.