Afin de:
- Augmenter la sécurité de mon site Web
- Réduisez les besoins en bande passante
- Empêcher la collecte d'adresses e-mail
Afin de:
Aucun bot qui recueille des e-mails ou teste votre site pour des vulnérabilités ne respectera votre robots.txt. En fait, ces robots malveillants consultent le fichier robots.txt pour mieux cartographier votre site. Si vous avez un point, Disallow:
cela sera utilisé pour mieux attaquer votre site. Un pirate qui examine manuellement votre site devrait passer plus de temps à examiner tous les fichiers / répertoires que vous essayez de refuser.
robots.txt n'augmentera pas la sécurité de votre site Web et n'empêchera pas la collecte d'adresses e-mail. robots.txt est un guide permettant aux moteurs de recherche de sauter des sections de votre site Web. Ceux-ci ne seront pas indexés et devraient être utilisés pour toutes les sections que vous ne souhaitez pas afficher dans les moteurs de recherche publics.
Cependant, cela n'empêchera en aucun cas d'autres robots de télécharger l'intégralité de votre site pour augmenter la sécurité ou empêcher la collecte des e-mails. Pour augmenter la sécurité, vous devez ajouter l'authentification et autoriser uniquement les utilisateurs authentifiés au-delà des sections sécurisées. Pour empêcher la collecte d'adresses e-mail, ne placez pas les e-mails en texte brut (ou texte facilement déchiffrable) sur un site Web.
la source
robots.txt ne vous aidera pas avec la sécurité. Tout bot qui veut faire quelque chose de louche l'ignorera de toute façon.
la source
Le fichier robots.txt ne sert qu'à demander aux robots et aux araignées de laisser certains éléments de contenu seuls; cela ne peut pas réellement empêcher leur accès. Les "bons" bots le respecteront, mais les "mauvais" (probablement ceux que vous voulez bloquer) l'ignoreront et continueront quand même.
la source
Au lieu de robots.txt, vous devrez peut-être utiliser des codes CAPTCHA.
la source