Utilizzo di rel = canonical con syndication


21

Lavoro in un sito che consente la diffusione di contenuti (tramite API e dump di dati). Stiamo scoprendo che un certo numero di siti che ripubblicano i nostri contenuti appaiono più in alto nei risultati di ricerca di Google, anche se siamo l'editore originale. Questo è frustrante.

Stiamo valutando di far rel=canonical parte dei nostri requisiti di attribuzione. Google afferma che è legittimo utilizzarlo in tutti i domini e in scenari di sindacazione.

Hai fatto questo e Google considera l'URL canonico nelle classifiche di ricerca? Ci aiuterà a ridurre tale "spam" SERP?


1
Quello che stai descrivendo non è spam. Sono le persone che fanno ciò che stai chiedendo loro di fare: sindacare i tuoi contenuti. Lo spam è annunci e-mail e pagine Web non richiesti creati al solo scopo di bombardare le persone con annunci invece di creare qualcosa di valore. Se questi sono i tipi di siti che sindacano i tuoi contenuti, allora devi ripensare il tuo modello di sindacazione, o ciò si rifletterà male sul tuo sito (solo attraverso l'associazione). Ma semplicemente avere un ranking di ricerca migliore di te non crea spam nel sito.
Lèse majesté,

@ Lèse davvero? questi siti sembrano violare direttamente la regola del "contenuto originale scarso o assente" stabilita da Google stessa google.com/support/webmasters/bin/answer.py?answer=66361
Jeff Atwood l'

@Jeff: a quali siti ti riferisci specificamente? Sto parlando dell'atto di utilizzare la stessa web syndication, cosa che fanno molti siti legittimi. Un sito di spam non deve utilizzare contenuti sindacati e il semplice utilizzo di contenuti sindacati non rende un sito un sito di spam (anche se raggiungono un posizionamento migliore di te). Nel caso specifico, molte importanti pubblicazioni di notizie utilizzano contenuti sindacati di AP per integrare i propri contenuti. È contenuto duplicato? Sì. Ma è spam? No. E non penso nemmeno che AP stia promuovendo lo spamming.
Lèse majesté,

@ Lèse le parole chiave qui completano il proprio contenuto . Se TUTTO il contenuto viene copiato, quale valore o interesse viene creato esattamente?
Jeff Atwood,

1
@Jeff: Dalla domanda di Matt non è chiaro che quelli siano i siti a cui si riferisce. Ha semplicemente affermato che ci sono siti che ripubblicano il suo contenuto (che ha lo scopo di fornire un'API di syndication) che si collocano in una posizione superiore rispetto al contenuto originale. Ciò, per me, non implica che questi siano (necessariamente) siti di spam. Ma forse la mia interpretazione della domanda non è corretta.
Lèse majesté,

Risposte:


10

Jeff ha ragione al 100% in tutto ciò che ha detto.

Un altro problema con la richiesta di un sito di syndication da utilizzare <link rel="canonical" href="http://example.com/foo">è che dice a Google che la pagina di syndication non dovrebbe ottenere il Page Rank e http://example.com/foodovrebbe invece ottenerlo tutto.

Ciò crea due problemi principali.

  1. La pagina di syndication non verrebbe visualizzata affatto nelle ricerche di Google perché non ha un ranking nella pagina. Il sito di syndication non sarebbe minimamente contento di questo. Rendendo improbabile che sarebbero disposti a fare il cambiamento se potessero.
  2. Potrebbe non influire sul tuo sito nel modo che preferisci perché in realtà non ti stai collegando al sito Syndication. Mi chiedo come Google gestirà questo. È vero che consentono cross site rel = "canonical", ma credo che lo scopo sia quello della migrazione del sito e di avere più siti sotto un host con lo stesso contenuto di avere una pagina defacto rispetto a un gruppo di pagine simili / stesse.

Questi sono alcuni punti positivi. Penso che la syndication sia un'area in cui esiste un motivo legittimo per la presenza di contenuti duplicati. In questo caso, è meglio lasciare da solo il contenuto duplicato e accettare che questo è syndication. Naturalmente, idealmente Google dovrebbe privilegiare la pagina originale piuttosto che le pagine dei partner di syndication. Forse è necessario creare un nuovo tag compreso tra rel="canonical"il <cite>tag HTML5 . In questo modo i motori di ricerca possono sapere quale pagina è l'originale per i contenuti duplicati legittimi.
Lèse majesté,

confermato, vedere la mia risposta da Matt Cutts di seguito.
Jeff Atwood,

14

La mia ricerca ha indicato che richiedere un collegamento indietro - e che il collegamento NON deve essere seguito - era di gran lunga il criterio più importante.

Se il sito "syndicating" non attribuisce il contenuto con collegamenti all'originale validi per i motori di ricerca da seguire, i motori di ricerca hanno un tempo molto più difficile tracciare l'origine del contenuto e devono applicare complessi "trova contenuti di testo duplicati in tutto il tutta l'euristica di internet.

Non sono più sicuro di quanto sia necessario.

Video correlato a Matt Cutts

http://www.youtube.com/watch?v=x8XdFb6LGtM

Matt ha detto che sarebbe una buona idea usare rel = "canonical" per tornare alla pagina in cui l'articolo ha avuto origine, proprio come ha spesso suggerito che gli articoli sindacati includono collegamenti convenzionali (cioè un <a>tag nchor) che rimandano al articolo originale.

Tieni presente che canonico non è solo schiaffeggiare rel="canonical"un <a>tag; è più così:

<html>
    <head>
         <link rel="canonical" href="http://example.com/foo">
    </head>
...

Quindi richiede un diverso tipo di lavoro, devi modificare ogni intestazione di pagina. Non sono sicuro che molti di questi "sindacati" avranno quel livello di controllo rispetto a un semplice collegamento ( sans nofollow!) Alla fonte.


Suggerirei anche di leggere il blog di Jeff su questo argomento, Difesa dell'attribuzione
Scott Mitchell

@scott nota che originariamente non avevamo bisogno di un collegamento seguito, ma l'abbiamo modificato perché a causa del ragno di Google mancavano elementi presenti nel dump dei dati utilizzato da alcuni raschiatori ... e un collegamento mancante non seguito non aiuta a rimetterlo indietro nell'indice di Google!
Jeff Atwood,

@Jeff: In una leggera tangente, una cosa che mi ha infastidito è che i collegamenti in una risposta StackOverflow hanno rel = "nofollow". Gli utenti con un determinato rappresentante non dovrebbero trarre vantaggio da no rel = "nofollow" per i link che pubblicano?
Scott Mitchell,

@scott il campo del sito Web nel tuo profilo, in qualsiasi sito Web di Stack Exchange è stato rimosso il nofollow a 2k rep per gentile concessione.
Jeff Atwood,

1
@Jeff, sto parlando dei collegamenti in una risposta StackOverflow. Ad esempio, se faccio una vista / fonte proprio su questa pagina vedo i link nella tua risposta (come quello a YouTube) hanno rel = "nofollow". Presumo che questo sia per dissuadere gli spammer, ma allo stesso tempo sembra che ti stia perdendo un'opportunità per migliorare la pertinenza dei risultati di ricerca per gli altri, per non parlare del non "dare credito" (agli occhi di Google) alla persona che ha scritto il articolo / post di blog / ecc. a cui viene collegato.
Scott Mitchell,

2

Aggiungendo un'altra risposta perché ho ottenuto una risposta definitiva da Matt Cutts su questo:

rel=canonicalfunziona su più domini, ma si comporta sostanzialmente come un 301 [reindirizzamento] , quindi le pagine del sito di destinazione andrebbero direttamente al tuo sito su Google. Qualsiasi sito che utilizza i tuoi contenuti verrebbe sostanzialmente cancellato dai motori di ricerca.

Come dice Matt, il modo migliore di pensare rel=canonicalè un reindirizzamento permanente 301 .

Pertanto, richiedere il dominio incrociato rel=canonicalcome un insieme di termini di attribuzione sarebbe come chiedere loro di reindirizzare 301 a te! Ahia. : P

Sapendo questo, è chiaro che rel=canonicalè destinato esclusivamente all'uso su siti su cui hai personalmente il controllo, ad esempio quando sposti domini e hai bisogno del contenuto di un dominio per sostituire l'altro.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.