Ha senso restituire un 410 invece di 404 quando alcune pagine sono state rimosse in modo permanente?


16

Ha senso restituire un 410invece di 404quando una pagina è stata rimossa in modo permanente? In questo video , Matt Cutts afferma che Google li tratta allo stesso modo, ma ci sono altri motivi per implementare un 410(tranne che per la correttezza tecnica)?


Mi sono chiesto di questo da solo. Sembra che 410 non sia più usato da nessuna parte.
wogsland

Risposte:


7

Sul nostro sito Web abbiamo recentemente implementato 410 errori per le pagine che sono state rimosse in modo permanente. Abbiamo circa 40 milioni di pagine nell'indice di Google e riceviamo 2 milioni di richieste al giorno da Googlebot.

Dopo aver ripulito il nostro database, abbiamo trovato un gran numero di errori 404 visualizzati negli errori di scansione degli Strumenti per i Webmaster. Quando siamo passati a 410 stati invece di 404, il numero di errori al giorno è dimezzato mentre il numero totale di richieste fatte è rimasto pressoché invariato. Quindi, alla fine, sono le pagine a scansione più efficace al giorno. Sembra che le pagine con uno stato 404 vengano sottoposte a scansione più volte prima di essere rimosse completamente dall'indice.

Quindi direi, sì, vale sicuramente la pena utilizzare 410 ove appropriato al fine di mantenere il budget di Google Crawl.


11

C'è più di Google in questo mondo. Un 410 dice inequivocabilmente a un bot che il file è sparito. A 404 no. Un bot persistente potrebbe continuare a cercare un 404 indefinitamente mentre potrebbe smettere di cercare immediatamente un 410 che renderebbe molto felice il tuo server.


2
Va in entrambi i modi, però: un robot davvero schifoso potrebbe riconoscere solo 200 e 404.
Peter Taylor,

4
@Peter non è sicuro che sia importante - se sono scadenti e non capiscono i codici HTTP, quale danno farebbe? Se usi 404, sia i bot scadenti che quelli buoni continueranno a richiedere la pagina, mentre con 410 solo quello scadente lo farà.
DisgruntledGoat

1
Cosa ha detto @DisgruntledGoat. Vedi la legge di Postel . Le implementazioni scadenti semplicemente non possono essere prese in considerazione; che cosa hai intenzione di fare, provare e spiegare tutti loro e ciascuno dei loro particolari stranezze, tutti allo stesso tempo? Ci sono rare eccezioni, come ad esempio il dominio di lunga data del browser IE6, ma in generale non vale la pena.
Su '

6

Oltre al fatto che esistono più motori di ricerca di Google, non c'è motivo di presumere che Google non cambierà mai il modo in cui trattano 410 risposte. In effetti, sembra che sia già successo: le informazioni citate da Matt Cutts nel video provengono dal 2007, mentre questo post del 2009 di John Mu sui forum di Webmaster Central di Google dice diversamente:

"Ho seguito la cosa 404 vs 410 con la squadra qui. Come menzionato da altri qui e altrove, in genere li abbiamo trattati allo stesso modo in passato.

Tuttavia, dopo aver esaminato il modo in cui i webmaster li usano in pratica, ora trattiamo il codice risultato HTTP 410 come un po '"più permanente" di un 404. Quindi, se sei assolutamente sicuro che una pagina non esiste più e non esisterà più, usare un 410 sarebbe probabilmente una buona cosa ".

Quindi sembra che Google stia effettivamente trattando 410 risposte in modo diverso dalle 404.


4

Nella mia esperienza, Google non capisce 410 codici di errore.

Qualche tempo fa, ho cambiato un sito completo in modo che tutti i vecchi URL siano "410 andati". Non riesco a utilizzare i reindirizzamenti 301 perché non esiste una relazione diretta con un nuovo URL.

Ho usato a .htaccessper dire a Google che i vecchi URL sono spariti, ma continua a dirmi che ci sono un ENORME ammontare di 404 errori sul mio sito. Ho controllato gli URL nel rapporto sugli errori di scansione e sono tutti 410, non 404 come afferma.


1

C'è più di Google in questo mondo.

Citato per la verità. Dato il tuo requisito, per dire ai robot (e presumibilmente anche agli umani) che una pagina è stata rimossa in modo permanente , in realtà opterei per un 301reindirizzamento a una pagina che spiega (se necessario) perché il contenuto è stato rimosso o prendere il bot / utente torna alla pagina dell'indice.

I codici di errore HTTP meno noti di solito non sono così ben supportati, compresi o implementati su tutta la linea, quindi generalmente mi atterrò a quelli che sono al fine di garantire l'esperienza di navigazione prevista e, si spera, senza soluzione di continuità.

La scelta dell'opzione da scegliere dipende dal numero di richieste ancora in corso per il contenuto (ora) mancante.


1
Perché la necessità di spiegare la rimozione significa che è necessario 301 a un URL diverso con quella spiegazione? La spiegazione potrebbe essere sulla pagina stessa, con uno stato 410 in modo che i motori di ricerca capiscano che è morta.
IMSoP,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.