Nous voyons certaines pages qui existent dans notre sitemap.xml
mais qui sont inexplicablement absentes de l'index de recherche publique de Google.
Vous ne pouvez pas télécharger /superuser//sitemap.xml - nous protégeons ce fichier car il y a eu des problèmes avec lui dans le passé - mais googlebot le peut. Nous avons vérifié via les outils Google pour les webmasters que le sitemap.xml
fichier a été retiré aujourd'hui et qu'il est classé OK sans erreur (coche verte).
Le sitemap.xml
contient une liste des 50 000 dernières questions posées sur notre site. Par exemple, cette question ...
/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links
... existe dans le sitemap.xml
as ...
<url>
<loc>/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links</loc>
<lastmod>2010-10-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.2</priority>
</url>
La recherche de "Comment voir la fin d'une longue chaîne de liens symboliques" ne donne qu'un seul résultat à questionhub.com qui gratte nos données (un tout autre problème).
Vous pouvez incrémenter le nombre de questions et effectuer une recherche exacte du titre de la question et vous verrez ce modèle persister.
Ces URL sont dans sitemap.xml mais elles n'apparaissent pas dans l'index de Google - et pourtant elles apparaissent sur des sites qui récupèrent nos données Creative Commons. Pourquoi serait-ce?
Réponses:
Il semble que Google ait eu des problèmes d'exploration technique cette semaine, qui ressemblent remarquablement à ce que nous vivions:
http://searchengineland.com/is-google-broken-sites-big-small-seeing-indexing-problems-53701
la source
Google ne fait aucune offre ni garantie que les pages d'un plan de site seront indexées.
Mon expérience a été qu'une page doit être liée à (à partir d'une page d'une certaine autorité) pour apparaître. Cette page / question est-elle liée directement / indirectement à une page avec une certaine autorité?
Par exemple, si la page d'accueil de superuser.com (qui contient probablement de nombreux liens internes) est directement liée à cette question, ou indirectement liée à plusieurs autres pages, vous pouvez vous attendre à ce qu'elle soit indexée.
De google:
http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=156184
la source
Je pense que Google pourrait avoir du mal à indexer vos pages Web, 50 000 est beaucoup. Donc, ma suggestion serait de décomposer votre plan du site en morceaux comme ça
Si vous tombez en panne, vous aurez plus de chance d'avoir ces 50 000 URL indexées.
Sitemaps.org explication du problème
http://sitemaps.org/protocol.php
la source
Il semble que Google indique que 46 514 liens soumis figurent dans l'index. Serait-ce un problème avec (je déteste le dire) mais le classement des pages? Les sites de raclage peuvent faire un meilleur travail de réticulation, etc. et être mieux classés. Juste une pensée.
Ce site de recherche : superuser.com Comment voir la fin d'une longue chaîne de liens symboliques semble également récupérer correctement votre sitemap.xml, bien qu'il ne renvoie pas les résultats attendus.
la source
Avec ce type de chose, il y a beaucoup de réponses potentielles.
Je commencerais par vous demander combien de pages vous avez réellement. (vous avez soumis 50 000 URL sur un site rapide: superuser.com affiche 125 000 indexés. Pensez-vous que vous n'avez que 50 000 URL et que vous les soumettez toutes, mais Google trouve 2-3 copies de chaque page? % sont indexés) avoir une vue d'ensemble aide à déterminer où chercher les problèmes.
Si rien ne semble mal avec la première étape, je passerais au contenu, il semblerait que QH ait beaucoup plus de contenu sur sa page et relie de nombreuses autres "ressources" malgré le fait que tout leur contenu soit gratté, il est possible que Google considère leur page plus utile car ils fournissent plus de ressources / informations à l'utilisateur. S'ils sont considérés comme l'autorité et que tout votre contenu est le même que le leur, il est possible que Google n'indexe pas le vôtre même si vous êtes l'original.
Si vous êtes convaincu que ce n'est pas le problème, créez des liens de haute qualité, bloguez cette question sur certains blogs d'employés populaires ou demandez à des amis de bloguer à ce sujet, peut-être que si vous avez des amis SEO qui gèrent des blogs populaires, ils écriraient un étude de cas à ce sujet, etc.
Si vous obtenez beaucoup de liens solides et que l'indexation n'est toujours pas recherchée, cela pourrait être pénalisé (dans la plupart des cas, ce ne sera pas le problème, mais cela ne fait jamais de mal à vérifier).
Si rien de tout cela ne fonctionne, alors 9 fois sur 10, c'est un simple problème technique qui a été ignoré (exclusion des robots ou quelque chose de similaire).
Si vous n'avez toujours pas de réponse après avoir traversé cette question, demandez à Google et espérons qu'ils vous obtiendront une réponse.
la source
La question vient d'être posée hier - donnez une chance à Googlebot, vous n'êtes pas le seul site sur Internet qu'il doit explorer, vous savez :)
Si les questions sont normalement indexées dans un jour ou deux, et qu'une semaine se passe et que celle-ci n'est toujours pas indexée, alors je pourrais être inquiet. Mais certainement pas après 1 jour.
la source