La wget
page de manuel indique ceci, sous la section pour le --random-wait
paramètre:
Some web sites may perform log analysis to identify retrieval
programs such as Wget by looking for statistically significant
similarities in the time between requests. [...]
A 2001 article in a publication devoted to development on a popular
consumer platform provided code to perform this analysis on the
fly. Its author suggested blocking at the class C address level to
ensure automated retrieval programs were blocked despite changing
DHCP-supplied addresses.
Je souhaite obtenir une copie de cet article pour lecture, et j'ai essayé de nombreuses recherches sur Internet pour déterminer l'article. Cependant, tout ce que je peux trouver avec ces recherches est la page de manuel pour wget
hébergée sur différents sites Web; et d'autres documents de recherche n'ayant aucun rapport avec ce sujet.
Quelqu'un sait-il à quel article il est fait référence et où je peux en obtenir une copie?
wget
man
documentation
user2064000
la source
la source
Réponses:
Même si ce n'est pas une réponse directe,
git blame
etgit log
révéler que cette section a été introduite dans le commit 2c41d783 par un committer appeléhniksic
, qui se révèle être Hrvoje Niksic. Son adresse e-mail se trouve dans leChangeLog
fichier de wget (je ne la publierai pas ici pour des raisons évidentes). Je suggère de lui demander directement, car il pourrait être le meilleur pour donner une réponse plus adéquate. Pendant que vous y êtes, vous pourriez envisager de lui demander s'il serait disposé à mettre à jour la page de manuel en conséquence. ;)la source
Je pense que ce pourrait être cet article:
Création de données significatives à partir de journaux Web à l'aide de SAS de base
Il y a un paragraphe sur le blocage des plages de classe C:
Et l'un mentionne
wget
dans le blocage basé sur les chaînes de l'agent utilisateur:C'était le cinquième résultat dans Google pour "l'analyse de journal wget" pour l'année 2001 .
la source