Dans les outils Google pour les webmasters, j'ai remarqué que ma page d'accueil a été indexée deux fois:
example.com/
example.com/?chocaid=397
Je sais que je pourrais résoudre ce problème en utilisant le type de lien canonical
, mais je me demande: d'où vient ce paramètre?
Il existe différents sites qui ont des pages indexées avec ce paramètre / valeur même: https://duckduckgo.com/?q=chocaid%3D397 .
J'ai cherché des similitudes entre ces sites. mais je n'ai pas trouvé de conclusion: c'est souvent la première page, mais pas dans tous les cas. Certains sont NSFW, mais pas tous. Lorsque l'URL d'un domaine a ce paramètre, souvent d'autres sous-domaines du même domaine l'ont aussi.
Exemples
Entrée Wikipédia
Microsoft Codeplex
url
url-parameters
unor
la source
la source
?chocaid=397
être indexé, il est probable que quelque chose s'y relie pour que Google trouve le lien en premier lieu??chocaid=397
pourrait être une sorte de tentative de jouer avec les hachages (je ne sais pas grand-chose à ce sujet, donc je ne suis pas sûr de cela, cependant). C'est aussi une excellente question.Réponses:
Quelle est la nouveauté de votre domaine? Il se peut très bien que ce soit une requête populaire sur l'ancien domaine et donc vous obtenez toujours des "visiteurs". Cette carte correspond-elle à une page valide ou à une 404? Si vous obtenez beaucoup de hits là-bas et que c'est un 404, je le remapperais (utilisez un .htaccess) sur votre page d'accueil ou quelque chose.
la source
canonical
, mais cette question concerne davantage l'origine de ce paramètre.Il se peut que Googlebot essaie d'accéder à jQuery / Javascript et explore tout ce qu'il peut. Il y a eu un récent post ici sur une personne demandant de l'aide, car Googlebot explorait des URL non valides sur son site. John M a répondu sur la façon dont Googlebot peut rechercher plus d'URL à explorer à partir de scripts sur leur site. Il travaille pour Google Webmaster Tools. Vous avez à peu près répondu à votre propre question en définissant la balise canonique.
la source
Bien que je n'ai pas de réponse définitive, il y a quelques choses que j'ai trouvées en examinant cela qui peuvent aider à le réduire:
Ma meilleure supposition serait qu'il existe / était un site de grattage qui ajoute cette URL à tous les liens qu'il trouve. Certes, les liens externes semblent l'explication la plus probable d'où ils viennent, et les répertoires sont peu probables en raison de leur ajout à des pages assez aléatoires.
la source
Cela peut provenir d'un fournisseur d'annonces que vous pourriez avoir, j'ai le même problème et le seul endroit possible d'où cela vient est d'un fournisseur de publicité injectant des logiciels malveillants via les codes javascript.
la source