Clients demandant des URL tronquées

11

J'ai remarqué quelques 404 étranges qui semblent être du code de réécriture d'URL cassé. Notre visionneuse d'images demande des vignettes en utilisant des URL comme celle-ci:

/media/204/service/dzi/1/1_files/7/0_0.jpg

Je vois des demandes - bien inférieures à <1% - d'URL légèrement modifiées:

/media/204/s/rvice/d/i/1/1_files/7/0_0.jpg

Ces demandes proviennent d'adresses IP partout dans le monde (États-Unis, Canada, Chine, Russie, Inde, Israël, etc.), d'utilisateurs de bureau et mobiles avec plusieurs agents utilisateurs (Chrome, IE, Firefox, Mobile Safari, etc.), et il y a souvent une activité normale au sein de la même session à partir de la même adresse IP, donc je suppose qu'il s'agit d'un malware ou d'un proxy / filtre cassé. Je ne les ai pas vus d'autre chose que des images, ce qui suggère que cela peut être une sorte de filtre de contenu.

Quelqu'un d'autre a-t-il vu cela? Mes journaux CDN montrent la première demande le 8 juin, passant de plusieurs dizaines à plusieurs centaines par jour.

Chris Adams
la source
1
Fait intéressant, cela semble avoir changé dans la nature. Je vois maintenant des choses comme /se/vice/zi/ou /s/rvice/zi/plus communément que /s/rvice/d/i/ci - dessus.
Chris Adams
2
Quelle est l'URL du site? et à quoi ressemble votre htaccess.
Simon Hayter
Un exemple de page serait wdl.org/en/item/204/zoom - dans n'importe quel navigateur normal, ces chemins codés en dur sont transmis correctement. Un exemple qui vient de se produire montre que cela n'est pas non plus limité par l'agent utilisateur - j'ai tout vu d'IE à Chrome et, maintenant, le Kindle Silk Browser: "" / media / 4395 / ervice / dz / 1 / 1_files / 12 /8_4.jpg HTTP / 1.1 "404 3091" wdl.org/en/item/4395/zoom "" Mozilla / 5.0 (Macintosh; U; Intel Mac OS X 10_6_3; en-us; Silk / 1.0.22.153_10033210) AppleWebKit /533.16 (KHTML, comme Gecko) Version / 5.0 Safari / 533.16 Silk-Accelerated = true "
Chris Adams
@ChrisAdams Sur quel cadre ou langue votre site Web est-il construit?
Anagio
1
Pour ce que ça vaut, j'ai vu des URL similaires. Je n'ai pas de réponse solide mais dans mon cas, où j'ai pu la retrouver, elle a toujours été associée à ce qui ressemble à des liens générés automatiquement de "publications liées à partir du Web".
s_ha_dum

Réponses:

1

Je pense que ce sont des demandes DZI (Deep Zoom Image). Votre application traite-t-elle des cartes? Silverlight le plus probable?

Vous obtenez cela car l'une des images de la collection est manquante ou la collection DZI n'est pas définie correctement.

http://msdn.microsoft.com/en-us/library/cc645022(v=vs.95).aspx

Danilo Kobold
la source
1
Ce sont des fichiers DZI mais ce n'est pas parce qu'il manque un fichier - le nom de fichier demandé est en fait faux. Dans mon exemple ci-dessus, j'ai montré la forme correcte que presque tous les clients demandent, mais dans certains cas, un échec non évident provoque la conversion d'un seul caractère en/
Chris Adams
1

Parfois, les utilisateurs modifient les URL pour voir comment votre site réagit. J'ai fait cela avec plusieurs sites où j'avais besoin d'images de référence haute résolution et j'ai pensé que le site mettait à l'échelle les images en fonction de la REQUEST_URI. Parfois (en fonction de la bibliothèque utilisée), vous pouvez changer des choses comme les dimensions, les répertoires et les proportions pour obtenir des messages d'erreur (pour vous dire ce que quelqu'un exécute sur son serveur) et vous pouvez agrandir (images non mises à l'échelle).

La plupart des sites qui utilisent le logiciel de mise à l'échelle des images le font pour augmenter l'optimisation des pages, et la plupart des utilisateurs ont tendance à télécharger des images qui ne sont pas réduites [à la baisse] depuis leur appareil photo numérique d'origine (parfois jusqu'à 24 méga pixels).

Une autre possibilité (plus probable)

Étant donné que les adresses IP proviennent du monde entier, il peut y avoir un problème connu avec le logiciel que vous utilisez et ils (à l'aide d'un botnet) tentent d'exécuter un exploit pour une version non corrigée.

Zéro absolu
la source