Récemment, j'ai remarqué que j'avais une liste croissante d'erreurs Soft 404 dans Google Webmaster Tools. Ils sont tous destinés aux pages de résultats de recherche générées dynamiquement qui indiquent "Aucune correspondance trouvée".
Je ne comprends ce que Google entend par soft 404 et pourquoi ils sont Signalement pour ces pages. J'ai donc ajouté <meta name="robots" content="noindex">
à ces pages.
Cependant, Google signale toujours de nouvelles erreurs Soft 404 pour les pages qui utilisent la balise META noindex .
Pourquoi Google signale-t-il une erreur pour une page que je lui ai dit de ne pas indexer?
Le problème est qu'avec toutes ces erreurs indésirables, je ne peux pas voir s'il y a de vrais problèmes qui doivent être corrigés.
Certains ont dit que ces pages devraient renvoyer un code d'état 404. Mais cela déplace simplement le problème vers l'onglet des erreurs 404. En outre, Google renvoie le code d'état 200 pour sa page sans résultats .
Je ne veux pas bloquer l'accès avec robots.txt parce que je veux que les liens sur ces pages soient suivis et je veux que Google voie la balise META noindex . De plus, il n'y a aucun modèle que je puisse utiliser pour les bloquer.
Google a trouvé ces URL en premier lieu parce que le contenu existait auparavant, mais a depuis été supprimé. Je ne peux pas retourner un code d'état 410, car mon code PHP n'a aucun moyen de connaître la raison pour laquelle aucun résultat n'a été trouvé.
Puis-je faire quelque chose pour mieux voir les vrais problèmes?
la source
Réponses:
Vous devez empêcher Google d'explorer les pages de recherche de site. Google ne veut pas explorer votre site de recherche du tout . Voici le blog de Matt Cutts de Google sur le problème: Résultats de recherche dans les résultats de recherche par Matt Cutts le 10 mars 2007 . Google pénalise désormais activement les sites qui permettent aux résultats de recherche de leur site d'être explorés et d'apparaître dans les SERPs de Google. En permettant à Googlebot d'explorer vos pages de résultats de recherche, vous risquez de perdre tout votre trafic de parrainage Google. Une astuce préférée d'un critique Google est d'utiliser la recherche de votre site pour des termes de spam tels que "Viagra". Lorsqu'ils voient une page explorable comme résultat (même si elle indique "aucun résultat pour le Viagra trouvé"), ils appliqueront une pénalité manuelle contre votre site en tant que site de spam.
Vous devez mettre votre recherche sur le site
robots.txt
. Assurez-vous simplement que Googlebot peut toujours explorer vos pages de contenu. Vous cesserez alors de recevoir de nouvelles erreurs 404 logicielles.Un grand nombre d'erreurs 404 (même des erreurs 404 faibles) ne nuisent pas au classement de votre site. Google signale les erreurs sur toutes les pages qu'il peut trouver et explorer, que vous souhaitiez ou non qu'elles soient indexées et que vous y liez ou non. Ils le font parce que les rapports d'erreurs sont uniquement à votre avantage et ils pensent que vous devriez être pleinement informé.
Voici ce que John Mueller de Google a à dire à ce sujet :
la source