Alcuni modi in cui le pagine inesistenti finiscono nell'indice di Google
Esistono 3 modi in cui pagine inesistenti possono finire su Google o su qualsiasi altro motore di ricerca per quella materia e questi sono:
Le tue pagine si collegano a queste pagine. (Può trattarsi di una Sitemap, una pagina del profilo, un commento sul blog o un collegamento basato su href ...) Ho visto alcuni plugin di WordPress, ad esempio, che contengono tali collegamenti perché sono stati sviluppati su un sito e poi caricati su la libreria di plug-in ma lo sviluppatore ha una configurazione della cache rilevata con il plug-in.
Un backlink punta a queste pagine.
Ho visto pagine di indice Google e stringhe che semplicemente non esistono, anche se la tua sembra avere parole che non vedo come Googlebot potrebbe inventarle.
Link interni
Ora è molto probabilmente un link interno di qualche tipo perché ho Google le tue pagine del titolo e tutto quello che ho trovato erano 3 pagine, Pro Webmaster, un altro sito che immagini questo e il tuo. Quindi sembra che qualcuno abbia creato questo link, o un'applicazione / plugin / malware.
indagare
Quindi per escludere che i tuoi utenti, te stesso o un'applicazione abbiano creato questi collegamenti, ciò che devi fare è accedere a SQL (idealmente PHPMyadmin) e cercare le stringhe. Assicurati che il database sia pulito da queste pagine .. Quindi supponendo che non si ottiene risultati per la ricerca di file cache e file php per queste pagine. Se non trovi nulla, è probabile che qualcuno l'abbia collegato anche tu e ora non è su Google perché è stato rimosso.
Reindirizzare la /?
stringa può essere dannoso se qualcuno esce per prenderti
Ora posso vedere che hai rimosso tutte le /?title=
stringhe e le ho reindirizzate alla home page, mentre questa è una cosa OK da fare, può anche essere dannosa allo stesso tempo e spiegherò ..
Se qualcuno sta inviando spam al tuo sito con cattivi backlink, la cosa peggiore che puoi fare è iniziare a reindirizzarli alla home page, poiché Google potrebbe vedere questo come un manipolo di pagerank. Questo perché 301 reindirizza il flusso di succo dal link esterno, se quel link accade è un sito di Viagra, allora stai dando una falsa indicazione a Google sul reindirizzamento e questo può tornare e morderti.
Devo amare i buoni vecchi 404
La cosa giusta da fare su pagine che semplicemente non esistono è utilizzare un 404, sono perfettamente normali e non dà in alcun modo a Google l'impressione che il tuo sito sia rotto. Tutte le pagine che non esistono non finiranno mai nell'indice di Google e chiunque ricolleghi a pagine inesistenti non dovrebbe danneggiare il tuo sito se un 404 viene restituito, tuttavia, come menzionato un 301 alla home page "POTREBBE" perché mantiene il succo.
1-2 anni fa direi che il reindirizzamento delle stringhe era il metodo migliore, ma dopo gli aggiornamenti di Panda e Penguin di Google ho visto siti provare ogni sorta di tentativo di danneggiare la reputazione online (Fondamentalmente Panda, Penguin punisce i siti per backlink di spam, link a pagamento e in genere collegamenti non pertinenti) Anche se Google afferma che è impossibile danneggiare la reputazione di altri online solleva la questione se questo è vero perché così tanti attualmente stanno inviando spam ad altri e come fanno a sapere che non è il webmaster che sta cercando di manipolare le proprie classifiche ? un'area discutibile ma concludiamola ... Credo che un 404 ti si adatti meglio in questa situazione.
La modifica della query dovrebbe essere diretta, piuttosto che reindirizzare per /
rimuovere la stringa e poi 301 /404/
.