Je cherchais aujourd'hui dans mes outils Google Webmaster pour mon site Web et je vois des titres en double pour les pages suivantes sur mon site Web (petit échantillon parmi tant d'autres sur l'index de mon site):
/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business
Ce ne sont certainement pas des pages que j'ai créées!
J'ai également regardé mes données structurées que j'ai créées sur mon site et je peux le voir (petit échantillon sur plusieurs):
Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)
Rien de tout cela n'est le résultat de quelque chose que j'ai fait. C'est évidemment une sorte de plan chagrin ou élaboré pour voler un pagerank.
Hier, j'ai installé des redirections et des canoniques php 301 automatisés sur toutes mes pages pour essayer de raffermir cela (grâce à l'aide merveilleuse des gens qui débordent de pile). Mais j'aimerais en savoir plus à ce sujet et quel est leur objectif.
Réponses:
Certaines pages inexistantes se retrouvent dans l'index de Google
Il existe 3 façons dont des pages inexistantes peuvent se retrouver sur Google ou tout autre moteur de recherche d'ailleurs:
Vos pages sont liées à ces pages. (Cela peut être dans un plan du site, une page de profil, un commentaire de blog ou un lien basé sur href ...) J'ai vu des plugins de WordPress par exemple qui contiennent de tels liens car ils ont été développés sur un site puis téléchargés sur la bibliothèque de plugins, mais le développeur a une configuration de cache qui est apparue avec le plugin.
Un backlink pointe vers ces pages.
J'ai vu des pages d'index et des chaînes Google qui n'existent tout simplement pas, bien que le vôtre semble avoir des mots que je ne vois pas comment Googlebot pourrait les créer.
Liens internes
Maintenant, il s'agit probablement d'un lien interne quelconque, car j'ai recherché vos pages de titre sur Google et je n'ai trouvé que 3 pages, Pro Webmaster, un autre site qui image ce site et le vôtre. Il semble donc que quelqu'un ait créé ce lien, ou qu'une application / un plugin / un logiciel malveillant l'ait.
Enquêter
Donc, pour exclure que vos utilisateurs, vous-même ou une application a créé ces liens, vous devez vous connecter au SQL (idéalement PHPMyadmin) et rechercher les chaînes .. Assurez-vous que la base de données est propre de ces pages .. Ensuite, en supposant vous n'obtenez aucun coup son temps de rechercher des fichiers de cache et des fichiers php pour ces pages. Si vous ne trouvez rien, c'est probablement parce que quelqu'un l'a également lié à vous et maintenant ce n'est pas sur Google car il a été supprimé.
Rediriger la
/?
chaîne peut être dangereux si quelqu'un sort pour vousMaintenant, je peux voir que vous avez supprimé toutes les
/?title=
chaînes et les avez redirigées vers la page d'accueil, bien que ce soit une chose correcte à faire, cela peut également être dangereux en même temps et je vais vous expliquer ..Si quelqu'un spamme votre site avec des backlinks désagréables, la pire chose que vous puissiez faire est de les rediriger vers la page d'accueil, car Google peut voir cela comme une manipulation du pagerank. C'est parce que 301 redirige le flux de jus du lien externe, si ces liens se produisent sur un site de Viagra, vous donnez une fausse indication à Google sur la redirection et cela peut revenir et vous mordre.
Je dois aimer les bons vieux 404
La bonne chose à faire sur les pages qui n'existent tout simplement pas est d'utiliser un 404, ce sont parfaitement normaux et cela ne donne en aucun cas à Google l'impression que votre site est cassé. Toutes les pages qui n'existent pas ne se retrouveront jamais dans l'index de Google et toute personne renvoyant vers des pages inexistantes ne devrait pas nuire à votre site si un 404 est retourné, mais comme mentionné, un 301 sur la page d'accueil 'MIGHT' car il conserve le jus.
Il y a 1-2 ans, je dirais que la redirection de chaînes était la meilleure méthode, mais depuis les mises à jour de Panda et Penguin de Google, j'ai vu des sites essayer de toutes sortes pour nuire à la réputation en ligne (Fondamentalement Panda, Penguin punit les sites pour les backlinks de spam, les liens payants et généralement des liens non pertinents) Même si Google prétend qu'il est impossible de nuire à la réputation des autres en ligne, cela soulève la question de savoir si cela est vrai pourquoi tant de spammeurs en font-ils actuellement et comment savent-ils que ce n'est pas le webmaster qui essaie de manipuler leur propre classement ? une zone discutable, mais résumons cela ... Je crois qu'un 404 vous conviendra le mieux dans cette situation.
La modification de la requête doit être simple, plutôt que de rediriger pour
/
que la chaîne soit supprimée, puis 301 vers/404/
.la source