Questions marquées «robots.txt»

Robots.txt est un fichier texte utilisé par les propriétaires de sites Web pour donner des instructions sur leur site aux robots Web. Fondamentalement, il indique aux robots quelles parties du site sont ouvertes et quelles parties sont fermées. C'est ce qu'on appelle le protocole d'exclusion des robots.

19
Comment interdire un répertoire entier avec robots.txt?

J'ai deux sites sur lesquels je travaille actuellement: un panier et un autre client. Les deux sont sous le même nom de domaine donc par exemple http://example.com/first_url http://example.com/second_url Ces deux URL ont des tonnes de pages en dessous http://example.com/first_url/product1...

17
Google cache-t-il le fichier robots.txt?

J'ai ajouté un fichier robots.txt à l'un de mes sites il y a une semaine, ce qui aurait dû empêcher Googlebot de tenter de récupérer certaines URL. Cependant, ce week-end, je peux voir Googlebot charger ces URL exactes. Google cache-t-il le fichier robots.txt et, dans l'affirmative, le...

14
Qu'est-ce qu'un fichier robots.txt minimum valide?

Je n'aime pas que je vois beaucoup d'erreurs 404 dans le fichier access.log de mon serveur Web. Je reçois ces erreurs parce que les robots tentent d'ouvrir un fichier robots.txt , mais n'en ont pas trouvé. Je veux donc placer un simple fichier robots.txt qui empêchera les erreurs 404 d'apparaître...

12
Robots.txt: dois-je interdire une page qui n'est liée nulle part?

Il y a des pages sur mon site Web que je souhaite que l'utilisateur puisse visiter uniquement si je lui donne l'URL. Si je n'autorise pas les pages individuelles robots.txt, elles seront visibles par quiconque les examinera. Ma question est la suivante: si je ne les relie pas de n'importe où, ou du...

12
Robots.txt - CSS autorise ou interdit

Les CSS et les modèles sont-ils autorisés dans le fichier robots.txt ? Cela devrait-il causer des problèmes? Dans Joomla, CSS et les modèles sont interdits dans le fichier robots.txt . S'il vous plaît, aidez-moi à trouver une solution pour mettre ou non des robots dans CSS, des modèles, etc. pour...

11
Google Preview obéit-il à Robots.txt?

Parce que ça ressemble à ça. Pour mes sites, nous interdisons le répertoire d'images et les aperçus sont toutes des images manquantes, ce qui donne au site un aspect bancal. Est-ce le cas et existe-t-il un moyen d'autoriser uniquement le bot de prévisualisation à accéder aux images à l'aide de...