Va bene. Cominciando dall'inizio. Non contrassegnare il 404 come riparato . In realtà stai prolungando il problema. Google proverà a recuperare una pagina che restituisce più volte un 404 prima di arrendersi. Questo perché l'errore 404 indica una situazione temporanea in cui un errore 410 indica che la pagina è andata . Quindi ogni volta che contrassegni un 404 come riparato , stai effettivamente dicendo a Google di riprovare, avviando così di nuovo il processo di eliminazione.
Lasciate queste pagine 404 per un po 'e Google smetterà di cercarle e lascerà cadere le pagine dall'indice. Ci vorrà del tempo, ma a corto di un errore 410, questo è il modo più semplice. Un errore 410 renderebbe il processo più veloce, ma è più difficile presentare un errore 410 e un 404 è l'impostazione predefinita che lo rende la soluzione più semplice e naturale.
Le pagine rimosse scompariranno tra circa 30-60 giorni se puoi aspettare. Dipende dalla frequenza con cui Google visita le tue pagine. Può richiedere più tempo, ma una volta trovati 404, a Google piace prima controllare il sito, quindi a seconda di quanti 404 ci sono, il tuo sito potrebbe essere più aggressivo.
L'utilizzo di una Sitemap non risolve in genere alcun problema con l'indice. Semplifica la vita ai motori di ricerca. Non viene mai considerato come l'elenco completo delle pagine di qualsiasi sito. Se un motore di ricerca legge una Sitemap e trova ancora pagine non elencate nella Sitemap, continuerà a indicizzare quelle pagine.
Un'opzione se ha senso farlo è elencare queste pagine nel tuo file robots.txt. Se non ce ne sono troppi (ovvero qualcosa che puoi fare e il tuo file robots.txt non sarebbe troppo lungo), sarebbe una soluzione più veloce. Altrimenti, aspetterei e lascerei che gli errori 404 scadano da soli.
Un'ultima parola. Tu starai bene. Veramente. Funzionerà molto bene per te se sei paziente.