Perché Google indicizza le pagine con una stringa di query? Utm_campaign


9

Di recente ho notato che Google sta indicizzando gli URL contenenti argomenti stringa di query utm_campaign, utm_source e utm_medium. Nei risultati, Google mostra gli URL con queste stringhe di query anziché l'URL canonico:

utm_campaign aggiunta all'URL

Capisco che questo potrebbe essere un problema di "contenuto duplicato", ma ho utilizzato il link rel=canonicaltag in tutto il mio sito Web. Ad esempio:

[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]

Schermata del tag canonico

La mia aspettativa è che Google dovrebbe utilizzare l'URL canonico per l'indicizzazione. Che cosa sto facendo di sbagliato?


2
Anche senza il tag canonico, Googlebot di solito ignora i parametri UTM perché sa che vengono utilizzati solo per il monitoraggio. Non li ho mai visti indicizzati prima, soprattutto non con un canonico.
Stephen Ostermiller

4
FWIW site:stackexchange.com inurl:utm_campaignrestituisce anche risultati simili (su una scala leggermente più grande). Si noti inoltre che le site:ricerche spesso restituiscono URL non canonici nei risultati, che normalmente non vengono restituiti nelle ricerche "normali". Tuttavia, anche gli URL di cui sopra sembrano essere restituiti anche in ricerche "normali".
MrWhite,

Risposte:


3

Esaminando il tuo sito Web così com'è ora, non sono troppo sicuro se questo sia un problema più / attualmente.

Il problema non è il collegamento interno sul tuo sito Web con l'inclusione di parametri UTM (come suggerisce un'altra domanda).

Sembra più che un processo che devi condividere il contenuto del tuo sito Web sui social media sia lasciare i parametri UTM negli URL e condividere quegli URL che, a un certo punto, li hanno portati a essere indicizzati.

È raro che ciò accada, ma è già successo in molti altri siti. Il fatto che siano solo tre le pagine indicizzate con questi parametri indica che non si tratta né di un problema serio né a livello di sito.

Ecco i passaggi che puoi prendere per aiutare a sradicare questo accada: -

1. Specifica un URL canonico sulle tue pagine

Lo stai già facendo e l'implementazione è corretta. Ciò assicurerà che solo l'URL canonico specificato venga assegnato peso nei motori di ricerca. Presumibilmente questo è sempre stato in atto, ma in caso contrario, questo potrebbe spiegare perché ci sono alcune vecchie istanze di pagine ancora indicizzate con parametri UTM.

Implementazione corretta di URL canonici

2. Chiedi a Google di non indicizzare i parametri UTM in Search Console

Nel caso in cui alcuni URL vengano indicizzati con i parametri UTM (come nel tuo caso), il parametro URL dovrebbe apparire come rilevato all'interno della sezione "Scansione> Parametri URL" di Google Search Console per il tuo dominio (vedi sotto).

Parametri URL UTM di Google Search Console

Anche se i parametri UTM non vengono visualizzati, è possibile "Aggiungi parametro" per crearli.

Basta selezionare No: Doesn't affect page content (ex: tracks usage)(noto come "Parametri passivi") e di solito Google eseguirà la scansione di un solo URL con un valore di parametro specifico .

3 Non consentire i parametri URL in robots.txt

Ciò impedirà a Google di indicizzare il contenuto di questi URL ma non gli stessi URL stessi (potrebbero comunque essere visualizzati nei risultati di ricerca ma ometteranno semplicemente la descrizione come di seguito).

Pagina indicizzata non consentita in robots.txt

Semplicemente aggiungendo qualcosa di simile al seguente sarebbe gestire questo da robots.txt: -

Disallow: /*?utm=*

Conclusione

I passaggi n. 1 e n. 2 dovrebbero essere eseguiti in via precauzionale e "best practice" e comunque il passaggio n. 3 oltre ai passaggi n. 1 e n. 2 (poiché non saranno efficaci da soli).

All'interno di Google Search Console, esiste anche la possibilità di rimuovere (temporaneamente) gli URL. Ciò è particolarmente utile se ci sono alcune pagine testarde ancora indicizzate ma sai che la fonte principale del problema è stata risolta e questa funzione dovrebbe essere sufficiente per sbarazzarsene una volta per tutte dai risultati della ricerca.

Non ho incluso questo come un passaggio sopra poiché, nonostante abbia già studiato in precedenza, non ricordo se supporterà URL con parametri [citazione necessaria]. Una volta conoscevo la risposta, ma la mia memoria mi manca in questa particolare occasione.

Ulteriori letture sulla rimozione di URL da Google .


1
Ma se blocchi questi URL da non sottoporre a scansione utilizzando robots.txt(# 3), non impedirai anche il monitoraggio di queste campagne ? ... E anche impedire la lettura del tag canonico in-page (# 1)?
MrWhite,

Sono d'accordo con ciò che dice w3dk su robots.txt. Se qualcosa usa noindex: /*?utm=*in robots.txt.
Stephen Ostermiller

2

Sembra che tu stia usando questi collegamenti all'interno del contenuto del tuo sito Web per collegare insieme le pagine.

Per assicurarti che Google non indicizzi, puoi aggiungere rel="nofollow"questi link all'interno del tuo sito Web e bloccare questi parametri dal file robots.txt:

Disallow : /*utm_campaign

Buona cattura che vengono utilizzati per i collegamenti interni. Ciò spiegherebbe la differenza dalla maggior parte dei siti in cui vengono generalmente utilizzati solo sui collegamenti in entrata.
Stephen Ostermiller

In realtà gli URL utm_campaign vengono aggiunti da Buffer.com - ad esempio, sembrano "utm_source = plus.google.com & utm_campaign = buffer". Non credo di utilizzare questi collegamenti in qualsiasi punto del sito Web.
Brendon,

1

Hai verificato che l'URL canonico sia stato indicizzato o no? Se l'URL canonico è stato indicizzato, non c'è nulla di cui preoccuparsi.

Puoi provare gli Strumenti per i Webmaster di Google e modificare il modo in cui Google gestisce i parametri URL qui .


1
Per alcuni URL, viene indicizzato solo l'URL utm_campaign. Per altre pagine, entrambi gli URL sono stati visualizzati nell'indice. Ieri ho usato lo strumento Visualizza come Google per eseguire la scansione di un URL (con la stringa di query utm_campaign) - l'URL ora sembra essere scomparso e l'URL canonico ora è indicizzato.
Brendon,

Inoltre, le statistiche di scansione ( screenshot ) sembrano mostrare pagine che richiedono molto tempo per eseguire la scansione (con una media di 2,3 secondi). Non sono sicuro che si tratti di un problema diffuso, ma forse Google sta riscontrando alcuni problemi durante la scansione del sito.
Brendon,

Puoi anche fare un po 'di pulizia quando un visitatore arriva sul tuo sito web. Usa il link Fresh URL script per rimuovere dinamicamente qualsiasi parametro UTM dall'URL dopo averne tratto beneficio. In secondo luogo aggiungi i parametri URL ...
muhammad usman,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.