Ho studiato questo argomento per diversi giorni e ho trovato molti suggerimenti contrastanti per quanto riguarda l'indicizzazione della ricerca. Sto lavorando a un progetto che ha molte pagine diverse che vanno dalle semplici descrizioni dei prodotti alla documentazione utente approfondita.
Ho suddiviso questa domanda in sezioni poiché ritengo che ciò lo renderà più utile per i futuri lettori di questa domanda.
Alcune delle mie scoperte
Diversi siti Web sembrano aver assunto contorni di documenti come i seguenti:
1. Programmer's Guide (https://www.dartlang.org/docs/)
1. Getting Started
2. Concepts
1. Libraries
2. Fundamental classes
etc.
Trovo interessante che l'esempio sopra non utilizzi l' <nav>
elemento con un'intestazione adatta. Mi piace la semplicità del contorno ed essendo Google sono abbastanza certo che sanno cosa stanno facendo quando si tratta di questo.
Ma sono confuso poiché lo schema sopra non menziona "Dart". L'unica menzione di "Dart" in senso semantico sembra essere all'interno <title>
dell'elemento principale del documento "Guida del programmatore | Dart: app Web strutturate".
La MDN (Mozilla Developer Network) è un altro brillante esempio di un sito Web che segue questo principio. Molti <h1>
titoli forniscono un contesto completo ( sezioni e contorni di un documento HTML5 ):
1. Sections and Outlines of an HTML5 Document
1. Untitled Section (nav)
2. Untitled Section (nav)
3. Structure of a Document in HTML 4
4. Problems Solved by HTML5
Mentre altri non hanno molto senso fuori dal contesto ( pratiche obsolete da evitare ). Ad esempio, la seguente struttura HTML5 si riferisce a CSS, HTML5 o C # ... con solo la struttura del documento da seguire, chissà!
1. Obsolete practices to avoid
1. Untitled Section (nav)
2. Untitled Section (nav)
3. Doctype
4. <meta> element and charset attribute
A peggiorare le cose, cosa succederebbe se l'MDN contenesse 2 argomenti con lo stesso (o molto simile) titolo "Pratiche obsolete da evitare" dove uno fa parte della loro guida CSS e l'altro fa parte della loro guida HTML ...
All'altra estremità dello spettro i siti Web sembrano utilizzare l' <body>
intestazione principale per il nome del prodotto (Foo) o il contenitore dell'argomento (Guida dell'utente per Foo). Dove tutte le pagine successive vengono quindi utilizzate <h2>
per il titolo della pagina effettiva.
La domanda
In che modo i motori di ricerca deducono il contesto di una pagina Web come quelli trovati sul sito Web MDN utilizzando il profilo DOM e HTML5?
Qual è il modo giusto per contrassegnare la seguente pagina HTML5 in modo che Google possa indicizzare la pagina nel contesto adatto? Questo include l'utilizzo di <title>
, <header>
e <h1>
gli elementi.
- Nome della ditta
- nome del prodotto
- Guida utente
- Iniziare
L'intestazione più significativa nell'HTML che viene visualizzata in un browser Web, dovrebbe rappresentare il contesto dell'intero sito Web (Nome azienda o Nome prodotto), la raccolta di argomenti (Guida per l'utente) o l'argomento attuale in mano (Guida introduttiva) ?
La mia ipotesi migliore
<!DOCTYPE html>
<html>
<head>
<title>Getting Started | User Guide | Product Name - Company Name</title>
</head>
<body>
<header role="banner"> <!-- Note: Lack of <h1> in here -->
<a id="logo" href="http://example.com">Company Name</a>
<nav>
<h1>Site Navigation</h1>
<ul> ... </ul>
</nav>
</header>
<main role="main">
<div class="product-name">Product Name</div>
<div class="document">User Guide</div>
<h1>Getting Started</h1>
<p>blah</p>
</main>
</body>
</html>
Portando al contorno:
1. Getting Started
<title>
per fornire un contesto. Ad esempio, è una cattiva idea includere lo stesso <h1>User Guide for Ubermachine</h1>
in ogni pagina in cui viene presentata l'intestazione dell'argomento <h2>Getting Started</h2>
... o dovrebbe iniziare il contorno <h1>Getting Started</h1>
con un accompagnamento <title>Getting Started | User Guide for Ubermachine</title>
per fornire un contesto utile per i motori di ricerca. Questa è una domanda SEO.
<title>
fornisce abbastanza contesto.