La guida per i webmaster di contenuti duplicati di Google definisce i contenuti duplicati (ai fini dell'ottimizzazione dei motori di ricerca) come "blocchi sostanziali di contenuti all'interno o tra domini che corrispondono completamente ad altri contenuti o sono notevolmente simili".
La guida di Google continua elencando i seguenti esempi di contenuti duplicati:
- Forum di discussione in grado di generare pagine sia normali che ridotte indirizzate ai dispositivi mobili
- Memorizza gli articoli mostrati o collegati tramite più URL distinti
- Versioni di pagine Web solo della stampante
sanzioni
I motori di ricerca devono penalizzare alcune istanze di contenuti duplicati progettati per inviare spam al loro indice di ricerca come:
- siti di scraper che copiano il contenuto all'ingrosso
- tecniche di rotazione degli articoli semplicistiche che generano "nuovi" contenuti sostituendo selettivamente le parole nei contenuti esistenti.
Quando i motori di ricerca trovano contenuti duplicati, possono:
- Penalizzare un intero sito che contiene contenuti duplicati. (quando lo spamming)
- Scegli una pagina come fonte canonica del contenuto e abbassa la priorità o non indicizza l'altra pagina con la duplicazione. (Comune)
- Non intraprendere azioni punitive e indicizzare più copie del contenuto (raro)
Evitare la duplicazione interna
Quando gli è stato chiesto di duplicare i contenuti, Matt Cutts di Google ha detto che dovrebbe farti del male solo se sembra spam , tuttavia molti webmaster utilizzano le seguenti tecniche per evitare inutili duplicazioni di contenuti:
- Assicurarsi che il contenuto sia accessibile solo con un URL canonico
- Se il tuo sito deve restituire lo stesso contenuto in più URL (ad es. Per una pagina "visualizzazione di stampa"), specifica manualmente un URL canonico con un elemento di collegamento nell'intestazione del documento
- Nel caso in cui il tuo sito restituisca contenuti simili in base ai parametri codificati nell'URL (ad esempio l'ordinamento di un catalogo prodotti), escludi i parametri URL in Strumenti per i Webmaster di Google
Diffusione del contenuto
La pubblicazione di contenuti sul tuo sito che è stata pubblicata altrove si chiama syndication dei contenuti. La creazione di contenuti duplicati tramite syndication dei contenuti può essere OK:
- Finché hai il permesso di farlo
- Dite ai vostri utenti qual è il contenuto e da dove proviene
- Si collega a una fonte originale (un collegamento diretto diretto al contenuto originale dalla pagina con la copia, non solo un collegamento alla home page del sito in cui è possibile trovare l'originale)
- I tuoi utenti lo trovano utile
- Hai qualcosa da aggiungere a quel contenuto in modo che gli utenti preferiscano trovare quel contenuto sul tuo sito piuttosto che altrove. (Commenti o critiche per esempio.)
- Hai anche abbastanza contenuti originali sul tuo sito (almeno il 50% originali, ma idealmente l'80% originali)
Sebbene Google non penalizzi per ogni istanza di contenuti duplicati, anche i contenuti duplicati non penalizzati potrebbero non aiutarti a ottenere visitatori:
- Stai competendo con tutte le altre copie che sono là fuori
- Google preferirà probabilmente la fonte originale del contenuto e la copia più affidabile del contenuto.
Google penalizzerà i contenuti duplicati pubblicati sul tuo sito Web da altre fonti se:
- Sembra essere raschiato o rubato (soprattutto senza attribuzione).
- Gli utenti non reagiscono bene ad esso (in particolare facendo clic su Google dopo aver visitato il tuo sito.)
- Ci sono così tante copie di esso là fuori che non c'è motivo di inviare utenti alla tua copia di esso.
- La tua copia non è l'originale, più affidabile o più utilizzabile; e non ha alcun commento o critica.
- Il tuo sito non ha abbastanza contenuti originali per bilanciare tutti i contenuti ripubblicati.
- Duplica le pagine così spesso all'interno del tuo sito che Googlebot ha difficoltà a eseguire la scansione dell'intero sito.
Internazionalizzazione e targeting geografico
La localizzazione dei contenuti è un'area in cui la duplicazione dei contenuti può essere utile per la SEO. È perfettamente bene pubblicare gli stessi contenuti su siti rivolti a paesi diversi che parlano la stessa lingua. Ad esempio, potresti avere un sito negli Stati Uniti, un sito nel Regno Unito e un sito australiano, tutti con lo stesso contenuto.
Con un sito per ogni paese, è solitamente possibile classificare meglio gli utenti in quel paese. Inoltre, è possibile soddisfare in modo specifico gli utenti di ciascun paese con differenze di ortografia minori, prezzi nella valuta del paese o opzioni di spedizione del prodotto. Per ulteriori informazioni sulla configurazione di siti Web con targeting geografico, vedere Come devo strutturare i miei URL sia per la SEO che per la localizzazione?
Trattare con Content Scrapers
Altri siti che rubano i tuoi contenuti e li ripubblicano senza autorizzazione possono occasionalmente causare problemi di contenuti duplicati per il tuo sito. I motori di ricerca lavorano duramente per garantire che sia difficile per i siti di scraper beneficiare della duplicazione dei contenuti . Se un sito di scraper ti sta causando problemi, potrebbe essere possibile rimuovere il sito dall'indice di Google presentando una richiesta DMCA a Google