Usiamo una sitemap su Stack Overflow, ma ho sentimenti contrastanti al riguardo.
I crawler Web di solito scoprono pagine da collegamenti all'interno del sito e da altri siti. Le Sitemap integrano questi dati per consentire ai crawler che supportano le Sitemap di raccogliere tutti gli URL nella Sitemap e conoscere tali URL utilizzando i metadati associati. L'uso del protocollo Sitemap non garantisce che le pagine Web siano incluse nei motori di ricerca, ma fornisce suggerimenti per i crawler Web per fare un lavoro migliore nella scansione del tuo sito.
Sulla base della nostra esperienza di due anni con le Sitemap, c'è qualcosa di fondamentalmente paradossale nella Sitemap :
- Le Sitemap sono destinate a siti che sono difficili da eseguire correttamente la scansione.
- Se Google non riesce a eseguire la ricerca per indicizzazione del tuo sito per trovare un link, ma è in grado di trovarlo nella Sitemap, questo non dà peso al link Sitemap e non lo indicizza!
Questo è il paradosso della Sitemap: se il tuo sito non viene sottoposto a scansione corretta (per qualsiasi motivo), l'utilizzo di una Sitemap non ti aiuterà!
Google fa di tutto per non offrire alcuna garanzia Sitemap :
"Non possiamo fare previsioni o garanzie su quando o se il vostro URL saranno scansionati o aggiunti al nostro indice" citation
"Non garantiamo la scansione o l'indicizzazione di tutti i tuoi URL. Ad esempio, non eseguiremo la scansione o l'indicizzazione degli URL delle immagini contenuti nella tua Sitemap." citazione
"la presentazione di una Sitemap non garantisce che tutte le pagine del sito verranno scansione o incluse nei nostri risultati di ricerca" citation
Dato che i collegamenti trovati nelle Sitemap sono solo raccomandazioni , mentre i collegamenti trovati sul proprio sito Web sono considerati canonici ... sembra l'unica cosa logica da fare è evitare di avere una Sitemap e assicurarsi dannatamente che Google e qualsiasi altro motore di ricerca possano correttamente spider il tuo sito utilizzando le semplici pagine Web standard che tutti gli altri vedono.
Con il tempo che avete fatto che , e stanno ottenendo spidered bello e fondo in modo Google può vedere che il tuo sito link a queste pagine, e sarebbe disposto a strisciare i link - uh, perché abbiamo bisogno di una mappa del sito, ancora una volta? La mappa del sito può essere attivamente dannosa, perché ti distrae dall'assicurare che gli spider dei motori di ricerca siano in grado di eseguire la ricerca per indicizzazione dell'intero sito. "Oh, non importa se il crawler può vederlo, schiaffeggeremo semplicemente quei link nella mappa del sito!" La realtà è piuttosto l'opposto nella nostra esperienza.
Ciò sembra più che ironico considerando che le sitemap sono state pensate per siti che hanno una raccolta molto profonda di collegamenti o UI complesse che possono essere difficili da individuare. Nella nostra esperienza, la Sitemap non aiuta, perché se Google non riesce a trovare il link sul tuo sito corretto, non lo indicizzerà comunque dalla Sitemap. Abbiamo visto questo provato più volte con domande Stack Overflow.
Ho sbagliato? Le sitemap hanno senso e le stiamo usando in qualche modo in modo errato?