Dois-je bloquer les pages d'archives Wordpress des moteurs de recherche?

9

J'utilise WordPress et des /sample-post/URL pour mes publications et /yyyy/mm/pour les archives.

Google a entièrement indexé le site.

Étant donné que les archives affichent actuellement des articles complets, j'ai pensé que je ne devrais pas laisser Google indexer les pages d'archives car elles contiennent les articles complets et ce sera du contenu en double. Ainsi, mon robots.txt contient:

Disallow: /2009/
Disallow: /2010/
Disallow: /2011/
Disallow: /2012/
Disallow: /2013/
Disallow: /2014/
Disallow: /2015/

Pensez-vous que ce soit une bonne pratique ou cela nuirait-il à mon classement et / ou à ma disponibilité?

cherouvim
la source
Bon article, juste pour être clair, tu veux dire tout bloquer sauf les catégories? La chose qui a attiré mon attention sur ce problème était la recherche d'images Google et elle a montré 4 images identiques, à partir de la balise / archive, de la page, du message et de la maison! Il est à la maison dans le cadre d'un curseur (messages en vedette). Alors, quel serait l'avantage de la catégorie sur les pages et les publications uniquement? Ou voulez-vous dire mix ou les 3? J'utilise également Yoast mais très nouveau dans ce domaine.

Réponses:

4

En effet, vous devez éviter les contenus en double sur votre site Wordpress. Wordpress génère souvent du contenu en double entre les catégories, les archives et les balises.

Afin de résoudre ce problème, vous pouvez bloquer les URL des archives dans le fichier robots.txt, mais la meilleure option est de placer des <meta name="robots" content="noindex, follow">pages d'archives pour éviter que ces URL soient indexées par Google.

Pour ce faire, vous pouvez télécharger le plugin Wordpress SEO depuis Yoast . Lorsque le plugin est installé, vous avez la possibilité de mettre cette méta où bon vous semble (sur les pages archives, sur les pages tags, sur les pages catégories ...). Vous pouvez alors aller dans le menu du plugin: SEO => Titres et métas .

À mon avis, les meilleures pratiques pour le référencement sont de mettre cette méta sur les pages d'archives et de balises et de laisser Google explorer les pages des catégories. J'ai toujours évité le contenu en double sur le site Wordpress comme celui-ci.

Zistoloen
la source
J'ai cependant remarqué que malgré l'index noindex, nofollow, Google indexe parfois encore ces pages, j'ai donc décidé de mettre ces pages dans robots.txt. J'ai écrit un article de blog sur: vladopandzic.com/search-engine-optimization-seo/…
Vlado Pandžić