Que doit-il se passer lorsque le contenu est supprimé?

9

Je m'interroge sur le traitement standard des liens de données supprimés d'une application et d'un point de vue SEO.

J'ai une application où les utilisateurs peuvent créer du contenu mais ils peuvent également supprimer du contenu. Quelle est la meilleure façon de gérer le trafic entrant vers des liens qui ont depuis été supprimés?

Dois-je les rediriger quelque part avec un 301 ou dois-je lancer une erreur différente et laisser la page intacte avec un message d'erreur?

Yasin Okumuş
la source
J'ai signalé cela pour la migration
John Conde

Réponses:

8

Si la page n'est pas remplacée par un nouveau contenu Envoyez un message d'état HTTP 410 GONE qui indique aux moteurs de recherche que la page n'existe plus. Demandez au contenu de la page de dire à l'utilisateur pourquoi la page a disparu et donnez-lui des options pour trouver du contenu existant sur votre site Web. Cela doit renvoyer à votre page d'accueil, à la carte du site (le cas échéant), à la page de recherche (le cas échéant) et aux liens vers un contenu similaire (si ce contenu existe).

John Conde
la source
1
Je tiens à vous avertir de ne pas marquer comme corrigée toute erreur 404 dans les outils Google pour les webmasters pour une page qui n'existe pas. Vous dites Google que la page n'existe et que vous avez résolu le problème et Google devrait essayer à nouveau. Si vous le laissez simplement, il disparaîtra avec le temps. Google réessayera plusieurs fois 404 erreurs avant d'abandonner.
closetnoc
5

La suggestion de John Conde de renvoyer un code de statut HTTP 410 Gone est bonne, mais, selon les circonstances, un vieux HTTP 404 Not Found simple pourrait être plus approprié.

Plus précisément, le code d'état HTTP 410 est destiné à signaler que la ressource a été délibérément et définitivement supprimée, ne devrait pas revenir et que les liens vers celle-ci doivent être supprimés. Les moteurs de recherche peuvent le traiter comme un signal pour retirer la liste du contenu, et non pour la remettre en vente même si de nouveaux liens vers celui-ci sont trouvés. Ainsi, s'il est possible qu'un utilisateur ait supprimé une page par erreur ou avec l'intention de la remplacer par un nouveau contenu, une ancienne réponse 404 simple peut être plus sûre.

En particulier, voici ce que dit la norme HTTP / 1.1 :

10.4.5 404 Introuvable

Le serveur n'a rien trouvé correspondant à l'URI de la demande. Aucune indication n'est donnée quant à savoir si la condition est temporaire ou permanente. Le code d'état 410 (disparu) DEVRAIT être utilisé si le serveur sait, par le biais d'un mécanisme configurable en interne, qu'une ancienne ressource est indisponible en permanence et n'a pas d'adresse de transfert. Ce code d'état est couramment utilisé lorsque le serveur ne souhaite pas révéler exactement pourquoi la demande a été refusée, ou lorsqu'aucune autre réponse n'est applicable.

10.4.11 410 disparu

La ressource demandée n'est plus disponible sur le serveur et aucune adresse de transfert n'est connue. Cette condition devrait être considérée comme permanente. Les clients dotés de capacités d'édition de liens DEVRAIENT supprimer les références à l'URI de demande après l'approbation de l'utilisateur. Si le serveur ne sait pas ou n'a pas la possibilité de déterminer si la condition est permanente ou non, le code d'état 404 (Not Found) DEVRAIT être utilisé à la place. Cette réponse peut être mise en cache, sauf indication contraire.

La réponse 410 est principalement destinée à faciliter la tâche de maintenance Web en informant le destinataire que la ressource est intentionnellement indisponible et que les propriétaires de serveur souhaitent que les liens distants vers cette ressource soient supprimés. Un tel événement est courant pour les services promotionnels à durée limitée et pour les ressources appartenant à des personnes ne travaillant plus sur le site du serveur. Il n'est pas nécessaire de marquer toutes les ressources indisponibles de manière permanente comme «disparues» ou de conserver la marque pendant une période de temps - cela est laissé à la discrétion du propriétaire du serveur.

Dans tous les cas, 404 est le code d'état le plus générique; si vous avez un doute quant à l'utilisation de 404 ou 410, l'utilisation de 404 n'est jamais une erreur.

Ilmari Karonen
la source