Da dove viene il parametro URL "? Chocaid = 397"?


9

In Strumenti per i Webmaster di Google, ho notato che la mia prima pagina è stata indicizzata due volte:

  • example.com/
  • example.com/?chocaid=397

So che potrei risolverlo con l'uso del tipo di collegamento canonical, ma mi chiedo: da dove viene questo parametro?

Esistono vari siti che hanno pagine indicizzate con questo stesso parametro / valore: https://duckduckgo.com/?q=chocaid%3D397 .

Ho cercato somiglianze tra questi siti. ma non ne ho trovato una conclusiva: è spesso la prima pagina, ma non in tutti i casi. Alcuni sono NSFW, ma non tutti. Quando l'URL di un dominio ha questo parametro, spesso lo hanno anche altri sottodomini dello stesso dominio.

Esempi

Voce di Wikipedia

inserisci qui la descrizione dell'immagine

Microsoft Codeplex

inserisci qui la descrizione dell'immagine


In Strumenti per i Webmaster di Google (o nei registri dei referer) ci sono indicazioni su quale pagina potrebbe essere collegata a questo URL?
MrWhite,

@ w3d: non ho accesso ad alcun registro. In GWT, era elencato in " Miglioramenti HTML " → "titoli di pagina ripetuti". Quindi temo di non poter ottenere informazioni sui referrer.
unor

Mi chiedevo solo se ci fosse qualcosa in Traffic> Link al tuo sito> I tuoi contenuti più collegati> Altro (per ottenere tutte le pagine collegate). Per ?chocaid=397essere indicizzati, quindi presumibilmente qualcosa lo sta collegando a Google per trovare il collegamento in primo luogo?
MrWhite,

@ w3d: Ah, capisco. Sfortunatamente, i dati mancano ancora per questo rapporto (probabilmente perché sto usando GWT solo da alcuni giorni).
unor

Non sono sicuro se questo aiuta, ma il numero 397 ha qualcosa a che fare con gli hash (vedi qui e qui ). Non sono sicuro che questo abbia qualcosa a che fare con questa domanda, ma ?chocaid=397potrebbe essere una sorta di tentativo di pasticciare con gli hash (non ne so molto, quindi non ne sono sicuro). Inoltre, questa è un'ottima domanda.

Risposte:


1

Quanto è nuovo il tuo dominio? Può darsi che questa sia una query popolare sul vecchio dominio e quindi stai ancora ottenendo "visitatori". Questa mappa corrisponde a una pagina valida o a 404? Se stai ottenendo molti successi lì ed è un 404, quindi lo rimapperei (usa un .htaccess) sulla tua homepage o qualcosa del genere.


1
Non ho ancora notato alcun visitatore; Ho visto la pagina indicizzata da Google. Si associa alla stessa prima pagina (come se il parametro fosse stato omesso). So che potrei reindirizzarlo o utilizzare canonical, ma questa domanda riguarda maggiormente l'origine di questo parametro.
unor,

2
Ma questo non spiega perché lo stesso parametro URL appare nei risultati di ricerca per molti altri domini.
MrWhite,

1

Potrebbe essere Googlebot che tenta di accedere a jQuery / Javascript e di eseguire la scansione di tutto ciò che può. C'è stato un recente post qui su qualcuno che chiedeva aiuto perché Googlebot stava eseguendo la scansione di URL non validi sul proprio sito. John M ha risposto su come Googlebot potrebbe essere alla ricerca di più URL per eseguire la scansione degli script sul proprio sito. Lavora per Strumenti per i Webmaster di Google. Hai praticamente risposto alla tua domanda impostando il tag canonico.


1

Anche se non ho una risposta definitiva, ci sono alcune cose che ho trovato esaminando questo che può aiutare a restringerlo:

  • I collegamenti compaiono anche in Bing e Yahoo, quindi non ha nulla a che fare con Google.
  • Appaiono su wiki, blog di Tumblr, blog di Wordpress e altri siti e quindi non verranno aggiunti tramite un exploit in alcun software specifico.
  • Appaiono su alcuni siti Tumblr di qualità molto bassa, quindi è improbabile che questi abbiano avuto pubblicità su di loro. Allo stesso modo, è improbabile che gli articoli di Wikipedia vengano promossi tramite pubblicità.

La mia ipotesi migliore è che esiste / era un sito di raschietto che aggiunge questo URL a tutti i collegamenti che trova. Certamente, i collegamenti esterni sembrano la spiegazione più probabile per la loro provenienza e le directory sono improbabili a causa del fatto che viene aggiunto a pagine abbastanza casuali.


0

Questo potrebbe provenire da un fornitore di annunci che potresti avere, ho lo stesso problema e l'unico posto possibile da dove proviene è da un fornitore di pubblicità che inietta del malware attraverso i codici JavaScript.


Hai una fonte / prova per questo? Significherebbe che Wikipedia è infettata da questo, in quanto vi sono alcune pagine di Wikipedia indicizzate con questo parametro.
unor,

Sì perché ho un blog che Google ha bloccato a causa di questo e dopo aver rimosso gli annunci dei colpevoli hanno iniziato a rimuovere il blocco
Raymund,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.