Ci sono indicatori chiari che il mio file Sitemap è utile?


73

Di recente ho creato un file sitemap.xml e l'ho caricato sul mio account Google Webmasters Tools . Google non ha segnalato problemi o errori con la sitemap caricata sul mio sito.

Ora la mia domanda è:

  • Come faccio a sapere se la mia Sitemap funziona con Strumenti per i Webmaster di Google?

Il motivo per cui lo chiedo è che non so cosa dovrei vedere o cercare, e sembra di aver caricato un file inutile.

Risposte:


93

Un file Sitemap aiuta i motori di ricerca a scoprire URL nuovi e aggiornati sul tuo sito web. In particolare, se il tuo sito Web è abbastanza grande, questo può aiutarli a concentrarsi sul contenuto nuovo e aggiornato, invece di dover strisciare ciecamente su tutto per vedere se qualcosa è cambiato. Ciò può comportare la ricerca di nuovi contenuti molto più rapidamente, il che può essere abbastanza evidente soprattutto se il sito è più grande o più complesso.

Con Google in particolare (lavoro in Google; non so come altri motori di ricerca li gestiscono), svolge anche le seguenti attività:

  • Trova il numero di URL indicizzati per il tuo sito Web: queste statistiche vengono ricalcolate quotidianamente e in modo accurato. Puoi trovarli nella pagina dei dettagli delle Sitemap .
  • Scopri problemi di canonicalizzazione: se i numeri lì non corrispondono , è spesso un segno che stai specificando gli URL nel file Sitemap che non corrispondono a ciò che troviamo durante la nostra scansione. Di solito è un segno che devi lavorare sulla canonicalizzazione .
  • Aiuto per la canonicalizzazione: quando troveremo sul tuo sito più URL che mostrano contenuti identici, daremo un ulteriore vantaggio a qualsiasi URL elencato in una Sitemap, anche se non utilizzi altri metodi di canonicalizzazione.
  • Trova parti del tuo sito non correttamente indicizzate: questi conteggi sono forniti per file Sitemap, quindi puoi creare file Sitemap separati per sezioni logiche del tuo sito, per scoprire le aree in cui Google non sta indicizzando quanto desideri.
  • Dai la priorità agli errori di scansione: nella sezione Errori di scansione , gli URL specificati nei file Sitemap sono elencati separatamente. Poiché hai specificato questi URL in modo specifico, supponiamo che tu li desideri indicizzati e che eventuali errori di scansione siano importanti.

Inoltre, è possibile utilizzare diverse estensioni nei file Sitemap (ad esempio per immagini, video, notizie o internazionalizzazione), se si sceglie di farlo. Queste estensioni sono tutte opzionali.

Per la maggior parte dei siti Web, l'elemento più visibile dei file Sitemaps è che puoi vedere il conteggio degli URL indicizzati. La visualizzazione può richiedere circa un giorno, quindi se hai appena inviato una Sitemap per la prima volta, potresti dover essere un po 'paziente. Mentre altri modi (ad esempio un sito: -query) sono approssimazioni molto, molto approssimative, questo conteggio è estremamente accurato.

Modificato per aggiungere: un'altra cosa che personalmente trovo estremamente utile per quanto riguarda le Sitemap è che se non le stai generando direttamente con il tuo CMS, invariabilmente scopri molto su come il tuo sito web è scansionabile e che tipo di URL vengono scoperti durante quel processo. Ho visto molti casi in cui la scansione di un sito Web con uno strumento dalla tua parte (ad es. Un generatore di Sitemap) risolverà i problemi che potresti perdere altrimenti, che siano ID di sessione negli URL, contenuti duplicati attraverso differenze di URL, spazi infiniti (come come calendari infiniti) o persino parti di un sito che non sono affatto collegate.


Informazioni fantastiche. Ho anche sentito che con alcuni siti ad alto traffico fortemente sottoposti a scansione è meglio non utilizzare una Sitemap perché Google fa un lavoro di scansione migliore e se manca qualcosa nella tua Sitemap potrebbe smettere di indicizzarsi.
Chris_O,

3
@Chris_O Stai combinando diversi problemi insieme. In questo esempio, non è che Google stia facendo un "migliore" lavoro di scansione da solo; la stessa Sitemap è difettosa. Questo non è un argomento diretto per "non usare affatto una sitemap". La soluzione a tale situazione è correggere la Sitemap. Inoltre, le Sitemap sono informative, non direttive. Qualcosa che manca in una Sitemap non significa che Google non la troverà da sola o la ignorerà.
Su

Il sito in questione ha oltre 40.000 pagine indicizzate e i nuovi contenuti vengono indicizzati in meno di 5 minuti (senza mappa del sito). In base alla tua risposta, inizieremo a costruirli e spezzarli in anni.
Chris_O,

@ john-mueller ciao signor. m. - una volta ho inviato una Sitemap di prova con 1000 URL, abbiamo ottenuto un conteggio dell'indice di circa 700, ora abbiamo testato tutti i 1000 URL tramite il sito: www.complete.org/url/to/the/page.html, siamo tornati un conteggio molto al di sotto dei 700 URL (più nella regione 200). Cosa significa questo?
Franz,

2
@Franz A volte sono coinvolti dettagli che rendono difficile riprodurre il conteggio degli URL indicizzati con il sito: -query. Ad esempio, ci sono situazioni in cui potremmo combinare più URL e mostrarne solo uno per un sito: -query. Quindi, se vedi una differenza lì, di solito non vale la pena preoccuparsi.
John Mueller,

6

Se non ricevi alcun errore, puoi presumere che Google lo abbia analizzato e sia a conoscenza dei contenuti. Ma ciò non significa che scansioneranno e / o indicizzeranno quelle pagine. Le Sitemap sono solo un altro modo per comunicare ai tuoi motori di ricerca le tue pagine. Non sono obbligati a scansionare e indicizzare alcune o tutte quelle pagine. Lo stesso vale per la ricerca di pagine tramite link o invio di URL.


1
Come informazioni aggiuntive, è abbastanza facile vedere se Google comprende la Sitemap. Controlla in Ottimizzazioni -> Sitemap. Ti dirà quanti URL sono stati inviati nella Sitemap. La sitemap viene letta correttamente i contenuti e ha trovato molti collegamenti in essa. Il secondo numero è il numero di quelli che sono stati indicizzati e, come sottolinea John, completamente fino a Google se ritengono che non ne valga la pena, nessuno o alcuni dei tuoi contenuti. Sarà sempre inferiore all'importo inviato, Google trova alcune pagine non troppo calde e non si preoccupa di esse.
Fiasco Labs,

1

Google di solito fa un buon lavoro di scansione del tuo sito Web se hai un buon numero di link di qualità. Se trascorri molto tempo guardando il numero di pagine che hai indicizzato, ti suggerirei di migliorare il tuo sito e ottenere alcuni link di qualità.


0

Forse uno strumento di convalida della Sitemap come questo , anche se non ho mai "non" visto la Sitemap iniziare a dare il via.


Il file è già stato convalidato. Non è questa la domanda.
Su '27

0

Per un sito Web più grande, ad esempio un sito Web con centinaia, migliaia o milioni di pagine, è abbastanza utile. Abbiamo avuto nel nostro sito aziendale con 400.000 pagine in cui gli URL sono stati creati in modo dinamico da ID contenuto e sono stati utilizzati parametri URL con &, Strumenti per i Webmaster di Google ti fornirà feedback sulle pagine sottoposte a scansione e ti mostrerà errori, puoi eseguire il debug o aprire la pagina e vedi di persona cosa c'è che non va. In questo modo Google ci ha effettivamente aiutato a creare un sito Web migliore e ci ha risparmiato un enorme imbarazzo alcune volte.

È anche utile vedere il numero di pagine indicizzate rispetto al numero di ricerche per indicizzazione.

Per i siti Web più piccoli, se il sito Web è un piccolo gruppo di pagine .html in cui ogni pagina è collegata tramite menu e il sito non viene aggiornato di frequente, se si carica una Sitemap, nulla cambierà rispetto ai risultati della ricerca. Non avrai alcun vantaggio di avere la sitemap caricata su qualcuno che non ha caricato la sitemap.

Avevo anche circa 20 piccoli siti Web, in cui avevo generato automaticamente sitemap generate da cron script e ho smesso di farlo. Un giorno ho scoperto che il mio errore non ha generato correttamente i file XML per circa 6 mesi, ma per fortuna Google ha ignorato il mio errore e ha indicizzato completamente questi siti Web anche quando le sitemap avevano errori, Google usa la sitemap solo come un suggerimento dove andare, non molto seriamente.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.