Si je ne veux pas définir de comportement spécial, est-ce correct si je n'ai pas la peine d'avoir un fichier robots.txt?
Ou le manque d'un peut-il être nocif?
la source
Si je ne veux pas définir de comportement spécial, est-ce correct si je n'ai pas la peine d'avoir un fichier robots.txt?
Ou le manque d'un peut-il être nocif?
L'absence d'un fichier robots.txt ne sera pas nuisible. Depuis le site Web de robotstxt.org :
Pour permettre à tous les robots un accès complet
User-agent: *
Interdire:(ou créez simplement un fichier "/robots.txt" vide, ou n'en utilisez pas du tout)
Cependant, même si vous ne spécifiez rien dans votre fichier robots.txt, c'est un bon moyen d' informer les moteurs de recherche de l'emplacement de votre sitemap XML . Vous pouvez le faire en ajoutant une ligne en haut de votre fichier robots.txt qui ressemble à quelque chose comme:
Plan du site: http://www.example.com/sitemap-host1.xml
Vous devez également savoir que ne pas l'avoir créera un grand nombre de 404 entrées dans vos journaux Web.
Si vous n'avez pas de "robots.txt", votre journal d'erreurs recevra beaucoup de 404 sur le fichier, ce qui pourrait être une sorte de contrariété, comme si vous n'avez pas de favicon.
la source
robots.txt
fichier, qui en plus sera téléchargé moins souvent en raison des moteurs de recherche appliquant un contrôle de cache HTTP approprié .Je pense qu'il faudrait avoir à être OK, sinon d' énormes étendues du web seraient un indexable par les araignées web.
Non
robots.txt
équivaut à «autoriser l'indexation par tout le monde»robots.txt
presque par définition.la source
L'absence d'un fichier robots.txt laisse au robot d'exploration le soin de décider ce qu'il peut et ne peut pas faire. Puisqu'il ne faut que quelques secondes pour éviter toute sorte d'ambiguïté, pourquoi ne pas en créer une qui permette à tous les agents d'accéder à tout?
la source
Eh bien, puisque
robots.txt
contient l'adresse de votre sitemap , ne pas en avoir est potentiellement dangereux.la source
En fonction de votre contenu, il ne devrait pas y avoir de problème à ne pas avoir de fichier robots tant que vous êtes impatient de voir chaque page de votre site indexée par les moteurs de recherche.
la source