En parcourant la section "Erreurs d'exploration" des outils Google pour les webmasters, j'ai découvert un ensemble de 500 erreurs très étranges en référence à mon site:
J'ai pu retrouver ce que sont ces personnages, et apparemment ce sont les deux premiers personnages de la zone d'utilisation privée Unicode . Ma police vient de les mapper sur une grenouille portant une minuscule couronne et un symbole qui ressemble au chiffre 7.
Ces symboles n'apparaissent que sur les adresses des fichiers non HTML; documents de bureau, PDF, etc. - mais ils n'apparaissent pas seulement dans le nom du fichier.
D'où viennent ces symboles et existe-t-il un moyen de m'en débarrasser pour que Google puisse explorer correctement mon site?
Quelques informations générales:
- Utilisation de Web Server exécutant WS2K3 avec IIS6 et PHP 5.3.8
- L'encodage du site est UTF-8
- Ces symboles n'apparaissent pas sur la page ou dans la source
la source
Réponses:
Ce n'est qu'une supposition, mais une possibilité est que quelqu'un d'autre crée un lien hypertexte vers vos fichiers avec du code cassé. Je sais que chaque fois que j'ai eu des demandes douteuses à mes sites, j'ai toujours été en mesure de les retrouver jusqu'au lien borked de quelqu'un d'autre. (Il est vraiment irritant que les araignées n'incluent pas d'en-têtes Http-Referer pour nous permettre d'identifier plus facilement la source de ces URL).
la source