Est-il judicieux de renvoyer un 410 au lieu de 404 lorsqu'une page a été définitivement supprimée?

16

Est-il judicieux de renvoyer un 410au lieu de 404lorsqu'une page a été définitivement supprimée? Dans cette vidéo , Matt Cutts dit que Google les traite de la même manière, mais y a-t-il d'autres raisons de mettre en œuvre un 410(à l'exception de l'exactitude technique)?

grosse blinde
la source
Je me suis posé des questions à ce sujet moi-même. Il semble que le 410 ne soit plus utilisé nulle part.
wogsland

Réponses:

7

Sur notre site Web, nous avons récemment mis en œuvre 410 erreurs pour les pages supprimées définitivement. Nous avons environ 40 millions de pages dans l'index Google et nous sommes explorés avec 2 millions de demandes par jour par le Googlebot.

Après avoir nettoyé notre base de données, nous avons constaté qu'un grand nombre d'erreurs 404 continuaient à apparaître dans les erreurs d'exploration sur les outils pour les webmasters. Lorsque nous sommes passés à 410 statuts au lieu de 404, le nombre d'erreurs par jour a diminué de moitié tandis que le nombre total de demandes effectuées est resté le même. Ce sont donc plus de pages explorées par jour avec succès. Il semble que les pages avec un statut 404 soient explorées plusieurs fois avant d'être complètement supprimées de l'index.

Je dirais donc que oui vaut vraiment la peine d'utiliser 410 le cas échéant afin de maintenir votre budget Google Crawl.

Stefan Verhoeff
la source
11

Il y a plus que Google dans ce monde. Un 410 indique sans ambiguïté à un bot que le fichier a disparu. Un 404 ne fonctionne pas. Un bot persistant pourrait continuer d'essayer de trouver un 404 indéfiniment alors qu'il pourrait arrêter d'essayer de trouver un 410 immédiatement, ce qui rendrait votre serveur très heureux.

John Conde
la source
2
Cela va dans les deux sens, cependant: un bot vraiment merdique pourrait ne reconnaître que 200 et 404.
Peter Taylor
4
@Peter n'est pas sûr que ce qui compte - s'ils sont merdiques et ne comprennent pas les codes HTTP, quel mal cela ferait-il? Si vous utilisez 404, les bots merdiques et bons continueront à demander la page, alors qu'avec 410, seul le merde le fera.
DisgruntledGoat
1
Ce que @DisgruntledGoat a dit. Voir la loi de Postel . Les implémentations de merde ne peuvent tout simplement pas être prises en compte; qu'allez-vous faire, essayer de rendre compte de chacun d'eux et de chacun de leurs caprices particuliers, tous en même temps? Il existe de rares exceptions, comme par exemple la domination de longue date du navigateur IE6, mais en général, cela ne vaut tout simplement pas l'effort.
Su '
6

Outre qu'il existe plus de moteurs de recherche que Google, il n'y a aucune raison de supposer que Google ne changera jamais la façon dont ils traitent 410 réponses. En effet, il semble que ce soit déjà arrivé: les informations que Matt Cutts cite dans la vidéo datent de 2007, alors que ce post de 2009 de John Mu sur les forums Webmaster Central de Google dit le contraire:

"J'ai suivi le dossier 404 contre 410 avec l'équipe ici. Comme mentionné par d'autres ici et ailleurs, nous les avons généralement traités de la même manière dans le passé.

Cependant, après avoir examiné comment les webmasters les utilisent dans la pratique, nous traitons maintenant le code de résultat HTTP 410 comme un peu "plus permanent" qu'un 404. Donc, si vous êtes absolument sûr qu'une page n'existe plus et n'existera plus, l'utilisation d'un 410 serait probablement une bonne chose. "

Il semble donc que Google traite désormais 410 réponses différemment des 404.

Ilmari Karonen
la source
4

D'après mon expérience, Google ne comprend pas 410 codes d'erreur.

Il y a quelque temps, j'ai changé un site complet donc toutes les anciennes URL sont "410 Gone". Je ne peux pas utiliser de redirections 301 car il n'y a pas de relation directe avec une nouvelle URL.

J'ai utilisé un .htaccesspour dire à Google que les anciennes URL ont disparu, mais il continue de me dire qu'il y a énormément d'erreurs 404 sur mon site. J'ai vérifié les URL dans le rapport d'erreur d'analyse et elles sont toutes 410, et non 404 comme il est indiqué.

user2623424
la source
1

Il y a plus que Google dans ce monde.

Cité pour la vérité. Compte tenu de votre exigence, pour dire aux robots (et probablement aux humains également) qu'une page a été supprimée de manière permanente , j'opterais en fait pour une 301redirection vers une page expliquant (si nécessaire) pourquoi le contenu a été supprimé, ou je prendrai le robot / utilisateur retour à la page d'index.

Les codes d'erreur HTTP moins connus ne sont généralement pas aussi bien pris en charge, compris ou mis en œuvre dans tous les domaines.Je m'en tiens donc généralement à ceux qui garantissent l'expérience de navigation attendue et, espérons-le, transparente.

Le choix de l'option à suivre dépend du nombre de demandes encore en cours pour le contenu (maintenant) manquant.

stealthyninja
la source
1
Pourquoi la nécessité d'expliquer la suppression signifie-t-elle que vous devez 301 vers une URL différente avec cette explication? L'explication pourrait être sur la page elle-même, avec un statut 410 pour que les moteurs de recherche comprennent qu'elle est morte.
IMSoP