J'utilise Drupal 7 et j'essaie d'utiliser la balise META "noindex" pour empêcher http://example.com/comment/reply/43/738 d'être indexé par les moteurs de recherche.
La page de commentaire / réponse est en cours d'indexation, même si j'ai utilisé le rôle suivant dans robots.txt:
Disallow: /comment/reply/
Dans quel fichier de modèle dois-je incorporer la balise META "noindex" pour / comment / reply / pages?
robots.txt
dossier?Réponses:
Vous pouvez utiliser n'importe lequel de ces codes dans robots.txt:
Cela négligera toutes les URL contenant des commentaires .
Vous pouvez également utiliser ce qui suit, pour négliger chaque URL contenant / commentaire .
Après cela, vérifiez si cela fonctionne ou non en utilisant le vérificateur Google Robots.txt .
la source
Dans template.php de votre thème, ou dans page.tpl.php, vous pouvez vérifier l'url de la page pour voir si la page est une page de commentaire, puis ajouter du code qui insérera la balise META.
Vous pouvez le faire dans la fonction template.php YOURTHEME_preprocess_html (), ou l'insérer quelque part près du haut de page.tpl.php. Le code à ajouter serait quelque chose comme ceci:
Voir drupal_add_html_head () .
la source
Mise à jour : les œuvres suivantes, elle s'imprime
<meta name="robots" content="noindex,follow" />
dans la section tête de toutes les pages accessibles via un chemin commençant parcomment
. C'est pour contourner le fait qu'une page comme comment / 3 porte en interne node / nid comme arguments, comme jmarkel l'a souligné ci-dessus.À l'aide d'un commentaire utile sur la fonction arg .
Espérons que cela sera éventuellement traité par le module Meta Tags - il y a une demande de fonctionnalité , mais il n'est pas encore clair si l'auteur du module souhaite prendre en charge cela.
[Mon commentaire précédent] Je voulais juste ajouter que l'utilisation de robots.txt n'est pas la réponse - comme vous l'avez déjà remarqué, les liens continuent d'apparaître dans les résultats de recherche malgré l'utilisation
Disallow: /comment
. Cela est attendu, car robots.txt indique au bot de ne pas explorer ces pages, mais il ne dit pas à Google de ne pas l'indexer. Comme expliqué sur SEOmoz Robots.txt et Meta Robots Best Practices for Search Engine Optimization :la source