Comment puis-je empêcher mes fichiers de plan de site XML de s'afficher dans les résultats de recherche Google comme ce résultat d'une site:
requête de recherche:
Je ne comprends pas pourquoi Google choisirait d'abord d'afficher les fichiers de sitemap dans les résultats de recherche. Ces fichiers ne sont pas destinés à la consommation humaine.
Google doit pouvoir l'explorer pour pouvoir le traiter, donc je ne peux pas le refuser dans robots.txt . Je ne veux simplement pas qu'ils le mettent dans les résultats de recherche après l'avoir traité.
google
sitemap
search-engine-indexing
googlebot
xml-sitemap
Stephen Ostermiller
la source
la source
/sitemap.xml
répertorié dans robots.txt , puis ce lien vers un autre ensemble d'autres sitemaps comme/sitemap-123.xml
et/sitemap-124.xml
. Je régénère les sitemaps tous les jours et les chiffres changent quotidiennement. Celui qui est indexé est assez ancien. Je n'y ai aucun lien sur mon site, mais il est possible qu'un autre site ait un lien quelque part./sitemap.xml
je suppose que ce plan de site particulier va maintenant tomber de l'index. Je voudrais empêcher Google de les montrer à la recherche d'utilisateurs à l'avenir également.Réponses:
Google indexe les plans de site XML (comme tout fichier XML). Si Google connaît une URL et renvoie une réponse valide, il va passer les règles d'inclusion de Google et pourrait être indexé. Personnellement, je soumets uniquement le plan du site via GWT et j'inclus une
Sitemap:
référence dans le fichier robots.txt, ce qui est certainement suffisant pour l'indexer.La méthode recommandée pour empêcher l'indexation de ces fichiers par Google consiste à inclure un
X-Robots-Tag
en-tête de réponse HTTP lors de la diffusion du plan de site XML. Par exemple:Tout comme l'inclusion d'une balise META robots dans les fichiers HTML, l'en-
X-Robots-Tag
tête peut être utilisé pour tout type de fichier.Référence: Ce document (de novembre 2008!) Semble citer notre propre John Mueller (Google) en ce qui concerne l'utilisation de la
X-Robots-Tag
réponse lorsqu'il s'agit de plans de site XML.Oui, Google indexera et classera votre fichier Sitemap XML
Pour plus d'informations, consultez le guide du développeur de Google:
spécifications de la balise Meta Robots et de l'en-tête HTTP X-Robots-Tag
la source
X-Robots-Tag: noindex
code d'en-tête? À l'intérieursitemap.xml
ourobots.txt
?header('X-Robots-Tag: noindex',true)
) ou, si vous utilisez Apache, dans votre fichier .htaccess ou votre configuration de serveur. Voir la réponse de Stephen pour un exemple de code. Voir également le guide du développeur de Google lié à ci-dessus.La réponse de MrWhite à propos de l'utilisation de X-Robots-Tag semble être la bonne façon de procéder.
Voici le code qui peut être utilisé dans les fichiers de configuration .htaccess ou Apache pour ce faire. (Référence: WebmasterWorld - Sitemaps apparaissant dans SERP - Comment éviter cela? )
Sous nginx, la configuration serait la suivante. (Référence: exemples Yoast X-Robots-Tag )
la source
Pourquoi est-ce important?
Si vous pouvez réellement trouver votre sitemap dans SERP, vous avez de plus gros problèmes.
Je me concentrerais plutôt sur la création de pages avec un contenu utile. De cette façon, vous aurez même du mal à trouver votre plan du site. Pas que vous vous en soucieriez de toute façon.
PS
Presque tout le monde garde les sitemaps au même endroit. Donc, si quelqu'un voulait trouver où vous le gardez, il le fera :)
la source
mettre ce qui suit dans le fichier robots.txt
envoyez plutôt votre plan du site via les outils Google pour les webmasters.
la source