Je viens de mettre à jour mon fichier robots.txt sur un nouveau site; Google Webmaster Tools signale qu'il a lu mon fichier robots.txt 10 minutes avant ma dernière mise à jour.
Existe-t-il un moyen d'encourager Google à relire mon robots.txt dès que possible?
MISE À JOUR: Sous Configuration du site | Accès Crawler | Testez robots.txt:
L'accès à la page d'accueil montre:
Googlebot est bloqué sur http://my.example.com/
FYI: Le robots.txt que Google a lu en dernier ressemble à ceci:
User-agent: *
Allow: /<a page>
Allow: /<a folder>
Disallow: /
Est-ce que je me suis tiré une balle dans le pied, ou est-ce que ça finira par lire: http: ///robots.txt (comme il l'a fait la dernière fois qu'il l'a lu)?
Des idées sur ce que je dois faire?
Réponses:
Dans le cas où quelqu'un d'autre rencontrerait ce problème, il existe un moyen de forcer google-bot à télécharger à nouveau le fichier robots.txt.
Allez dans Santé -> Récupérer en tant que Google [1] et demandez-lui de récupérer /robots.txt
Cela téléchargera à nouveau le fichier et google analysera également à nouveau le fichier.
[1] dans la précédente interface utilisateur de Google, il s'agissait de "Diagnostics -> Récupérer en tant que GoogleBot".
la source
Disallow: /
. Au lieu de cela, les rapports de récupération "Refusé par robots.txt": /.Je sais que c'est très ancien, mais ... Si vous avez téléchargé le mauvais fichier robots.txt (interdisant toutes les pages), vous pouvez essayer ce qui suit:
lorsque google essaie de lire le plan du site xml, il le vérifie contre robots.txt, forçant google à relire votre robots.txt.
la source
D'ACCORD. Voici ce que j'ai fait et en quelques heures, Google a relu mes fichiers robots.txt.
Nous avons 2 sites pour chaque site que nous exploitons. Appelons-les le site canonique (www.mysite.com) et le site de domaine nu (mysite.com).
Nous avons configuré nos sites afin que mysite.com renvoie toujours une redirection 301 vers le site www.mysite.com.
Une fois que j'ai configuré les deux sites dans les outils Google Webmaster, je lui ai dit que le site www.mysite.com est le site canonique, il a peu de temps après lu le fichier robots.txt sur le site canonique.
Je ne sais pas vraiment pourquoi, mais c'est ce qui s'est produit.
la source
Raccourcissez l'intervalle d'analyse Google pendant quelques jours.
De plus, je l'ai vu là-bas pour vérifier votre robots.txt, cela pourrait le forcer à Google, mais je ne suis pas sûr.
la source