Di recente ho avuto un hack che ha aggiunto diverse migliaia di pagine fasulle al mio sito.
Ho inviato una Sitemap corretta alla Console di ricerca di Google (precedentemente denominata Strumenti per i Webmaster) e ho trasformato tutti i link in 410, ma Google ne aveva ancora la maggior parte indicizzati.
Ho usato WebMaster Tools - Estensione di Chrome Bulk Removal URL per inviare automaticamente gli URL per la rimozione. È fondamentalmente uno script che prende un elenco degli URL e poi li invia per te, uno alla volta. Ci vorranno ore per inviarli tutti, ma almeno non dovrai farlo da solo. Ecco un articolo su come usarlo .
Puoi ottenere un elenco degli URL indicizzati da Google scaricando i dati direttamente dalla Search Console. Vai a Stato> Copertura indice e seleziona i risultati validi, quindi scorri verso il basso. Vedrai che Google ha indicizzato un sacco di URL che non sono presenti nella tua Sitemap. Puoi scaricare i primi 1000 risultati. C'è apparentemente un modo rotatorio per ottenerli tutti, non solo i primi mille, ma coinvolge le chiamate API da Excel. Ho solo aspettato qualche giorno tra ogni mille, mentre lentamente cadevano dall'indice.
Un altro percorso consiste nel fare in modo che un plug-in WP crei una sitemap, quindi filtra i PDF o qualunque sia il tuo target. Probabilmente dovrai fare un po 'di copia / incolla / elimina manualmente qui. Per sicurezza, ho scorrere lentamente il mio elenco di circa 2.700 URL di spam e cancellato gli URL legittimi. Ci sono voluti solo circa 20 minuti.
Se non si sta tentando di eseguire l'annullamento permanente di qualcosa, come lo spam, e invece si cerca di offuscare le risorse premium, è necessario utilizzare altri metodi per impedire l'indicizzazione di tali risorse, ad esempio un file di robot. Ma se si scopre che Google non ha ascoltato o hai lasciato cadere la palla, almeno ora puoi risolvere il problema e rimuoverlo dall'indice in pochi giorni.
Nella mia particolare circostanza, mi chiedo perché Google non abbia un pulsante della macchina del tempo, né annulla o reimposta. L'idea è che posso dire a Google che il sito è stato violato alcuni giorni fa, ma l'abbiamo riparato, quindi annulla l'ultimo x numero di giorni di scansione e indicizzazione. Ma sarebbe troppo facile.