J'utilise WordPress et des /sample-post/
URL pour mes publications et /yyyy/mm/
pour les archives.
Google a entièrement indexé le site.
Étant donné que les archives affichent actuellement des articles complets, j'ai pensé que je ne devrais pas laisser Google indexer les pages d'archives car elles contiennent les articles complets et ce sera du contenu en double. Ainsi, mon robots.txt contient:
Disallow: /2009/
Disallow: /2010/
Disallow: /2011/
Disallow: /2012/
Disallow: /2013/
Disallow: /2014/
Disallow: /2015/
Pensez-vous que ce soit une bonne pratique ou cela nuirait-il à mon classement et / ou à ma disponibilité?
seo
wordpress
robots.txt
duplicate-content
google-index
cherouvim
la source
la source
Réponses:
En effet, vous devez éviter les contenus en double sur votre site Wordpress. Wordpress génère souvent du contenu en double entre les catégories, les archives et les balises.
Afin de résoudre ce problème, vous pouvez bloquer les URL des archives dans le fichier robots.txt, mais la meilleure option est de placer des
<meta name="robots" content="noindex, follow">
pages d'archives pour éviter que ces URL soient indexées par Google.Pour ce faire, vous pouvez télécharger le plugin Wordpress SEO depuis Yoast . Lorsque le plugin est installé, vous avez la possibilité de mettre cette méta où bon vous semble (sur les pages archives, sur les pages tags, sur les pages catégories ...). Vous pouvez alors aller dans le menu du plugin: SEO => Titres et métas .
À mon avis, les meilleures pratiques pour le référencement sont de mettre cette méta sur les pages d'archives et de balises et de laisser Google explorer les pages des catégories. J'ai toujours évité le contenu en double sur le site Wordpress comme celui-ci.
la source