Google penalizza i tag <lastmod> aggiornati quotidianamente nelle Sitemap se i dati non vengono aggiornati quotidianamente?


10

Ho una sitemap che viene generata quotidianamente con molti link alle pagine dei prodotti. Questi prodotti vengono importati quotidianamente da un'altra fonte di dati. Poiché l'aggiornamento consiste nel buttare via tutte le informazioni sul prodotto corrente e sostituirle con le nuove informazioni importate, la data dell'ultima modifica salta sempre un giorno. Questo è anche usato nella Sitemap. Anche per prodotti che non sono cambiati. Tutte le pagine dei prodotti fingono di essere state aggiornate.

Google penalizzerà il sito Web perché finge che le pagine siano cambiate di giorno in giorno mentre non lo sono?

La mia soluzione sarebbe quella di modificare la voce solo se i dati del nuovo prodotto importato differiscono dai dati precedenti. Voglio solo assicurarmi che si tratti di un utile aggiornamento, mentre potrei anche dedicare il mio tempo ad altri miglioramenti.

Risposte:


5

Non ho mai sentito parlare di una sanzione a causa di questo. Nel peggiore dei casi stai sprecando il tempo del ragno, ma questo è parte del motivo per cui abbiamo i computer in primo luogo: fare noiose cose ripetitive. Tuttavia, dovresti idealmente affrontare il problema.

Questo...

La mia soluzione sarebbe quella di modificare la voce solo se i dati del nuovo prodotto importato differiscono dai dati precedenti.

... è quello che dovresti fare in primo luogo, indipendentemente da considerazioni esterne come sitemap, ecc. Se il tuo contenuto non è diverso (e includerei la cancellazione e la sostituzione con informazioni identiche in quella descrizione), la tua lastmoddata non dovrebbe non essere modificato. Qui stai sprecando le tue risorse. Non hai detto quanti prodotti sono coinvolti, ma ci sarà un punto in cui questo processo diventerà lento e costoso dal punto di vista computazionale.


Sono totalmente d'accordo. Tuttavia, sono affidabile per un'altra società che fornisce i dati. Inviano sempre ogni prodotto (+200) nelle loro esportazioni di dati. Quindi l'aggiornamento del lotto sembrava la soluzione migliore qualche anno fa. Il mio cliente non ha il budget per risolverlo correttamente. Queste esportazioni / importazioni avvengono di notte, quindi le risorse extra utilizzate non sono un grosso problema al momento.
Esplicito il

@Elicit se hai ancora questo problema, archivia le esportazioni di dati del giorno prima nel loro formato originale e analizzabile ed esegui un confronto git diff-style per vedere quali prodotti sono cambiati. Anche se è bello, non ti servono per inviarti solo i prodotti modificati; dovresti essere in grado di capirlo da solo.
Pinguino anonimo il

3

Non mi è mai piaciuta l'idea di aggiornare <lastmod>ogni giorno in quanto non è solo sbagliato, è fuorviante i motori di ricerca.

In un post su SO , Gary Illyes di Google ha scritto:

Il tag lastmod è facoltativo nelle sitmap e nella maggior parte dei casi viene ignorato dai motori di ricerca, perché i webmaster stanno facendo un lavoro orribile mantenendolo accurato.

In genere, ho sostenuto di utilizzare <lastmod>correttamente o per niente. Lasciarlo (così come <changefreq>& <priority>) rende anche il file stesso più piccolo e più veloce per i motori di ricerca.


2

No. Google userà lastmodcome suggerimento (lo stesso di tutti i valori delle Sitemap) ma se decide che i tuoi contenuti non vengono aggiornati quotidianamente, semplicemente li ignorerà e rivisiterà le tue pagine secondo il suo programma.


2

Non lavoro per Google e non posso dire con certezza cosa effettivamente fanno, ma il modo ragionevole per loro di trattare i <lastmod>timestamp sarebbe come un suggerimento per non perdere tempo a ripetere la scansione delle pagine che non sono cambiate.

Pertanto, se segnali tutte le pagine come modificate ogni giorno, Googlebot continuerà a eseguire la scansione di tutte le pagine nell'ordine in cui si sente, anziché concentrarsi solo sulle pagine che sono cambiate. In effetti, è come se non avessi segnalato alcun timestamp di ultima modifica.

Il motivo principale per fornire i <lastmod>timestamp corretti è quello di apportare più rapidamente modifiche al tuo sito nell'indice di Google. Se hai centinaia di pagine sul tuo sito, Google impiegherà un po 'di tempo per scansionarle tutte e trovare eventuali modifiche. Tuttavia, se dici a Googlebot quali pagine sono state modificate di recente, può prima eseguire la scansione di quelle pagine ed evitare di perdere così tanto tempo per il resto.

Ovviamente, puoi semplicemente aumentare la frequenza di scansione di Googlebot in Strumenti per i Webmaster e sperare per il meglio. Ma davvero, non dovrebbe essere troppo difficile fare in modo che il tuo script di aggiornamento conservi i timestamp. Ad esempio, suppongo che attualmente stai facendo qualcosa del genere:

for each product do:
    write new page content into product page file;
end do;

In tal caso, basta cambiarlo in qualcosa del genere invece:

for each product do:
    read old page content from product page file into string A;
    write new page content into string B;
    if A is not equal to B then:
        write string B into product page file;
    end if;
end do;


1

Google non ti penalizzerà per questo. Per ottenere una sanzione devi davvero andare black hat sul culo di Google, quindi non preoccuparti. Google scoprirà abbastanza presto se i tuoi contenuti sono cambiati (è quello su cui hanno lavorato negli ultimi anni) e usa la proprietà lastmod come suggerimento.


1

Ti consiglio di leggere questa Best practice per sitemap XML e feed RSS / Atom

Ora ultima modifica

Specifica un orario dell'ultima modifica per ciascun URL in una Sitemap XML e feed RSS / Atom. L'ultima ora di modifica dovrebbe essere l'ultima volta che il contenuto della pagina è cambiato in modo significativo. Se si desidera che una modifica sia visibile nei risultati della ricerca, l'ora dell'ultima modifica dovrebbe essere l'ora di questa modifica.

XML sitemap uses  <lastmod>
RSS uses <pubDate>
Atom uses <updated>

Assicurati di impostare o aggiornare l'ora dell'ultima modifica correttamente:

Specify the time in the correct format: W3C Datetime for XML sitemaps, RFC3339 for Atom and RFC822 for RSS.
Only update modification time when the content changed meaningfully.
Don’t set the last modification time to the current time whenever the sitemap or feed is served.

Grazie per l'aggiornamento. Speriamo che il downvoter lo veda e inverta il suo voto.
John Conde
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.