Existe-t-il des indicateurs clairs indiquant que mon fichier sitemap est bénéfique?

73

J'ai récemment créé un fichier sitemap.xml et l'ai chargé sur mon compte Outils Google Webmasters . Google n'a signalé aucun problème ni aucune erreur concernant le plan Sitemap téléchargé de mon site.

Maintenant ma question est:

  • Comment savoir si mon sitemap fonctionne dans Google Webmaster Tools?

La raison pour laquelle je pose cette question est que je ne sais pas ce que je suis censé voir ou rechercher, et j'ai l'impression d'avoir téléchargé un fichier inutile.

Stephen Ostermiller
la source

Réponses:

93

Un fichier Sitemap aide les moteurs de recherche à découvrir les URL nouvelles et mises à jour sur votre site Web. En particulier, si votre site Web est assez volumineux, cela peut les aider à se concentrer sur le contenu nouveau et mis à jour, au lieu d’avoir à parcourir aveuglément tout pour voir si quelque chose a changé. Cela peut permettre de trouver le nouveau contenu beaucoup plus rapidement, ce qui peut être assez remarquable, surtout si le site est plus grand ou plus complexe.

Avec Google en particulier (je travaille chez Google; je ne sais pas comment les autres moteurs de recherche traitent ces problèmes), il effectue également les tâches suivantes:

  • Trouvez le nombre d'URL indexées pour votre site Web: Ces statistiques sont recalculées quotidiennement et très précisément. Vous pouvez les trouver dans la page de détail des sitemaps .
  • Détectez les problèmes de canonisation: si les numéros ne correspondent pas , cela signifie souvent que vous indiquez dans le fichier Sitemap des URL ne correspondant pas à celles trouvées lors de notre analyse. C'est généralement un signe que vous devez travailler sur la canonisation .
  • Aide à la canonisation: lorsque nous trouverons sur votre site plusieurs URL affichant un contenu identique, nous attribuerons à toute URL figurant dans un plan Sitemap un avantage supplémentaire, même si vous n'utilisez pas d'autres méthodes de canonisation.
  • Rechercher des parties de votre site mal indexées: ces nombres sont fournis par fichier Sitemap. Vous pouvez ainsi créer des fichiers Sitemap distincts pour les sections logiques de votre site, afin de découvrir les zones dans lesquelles Google n'indexe pas autant que vous le souhaitez.
  • Hiérarchisez les erreurs d'analyse: dans la section Erreurs d'analyse , les URL spécifiées dans les fichiers Sitemaps sont répertoriées séparément. Étant donné que vous avez spécifiquement fourni ces URL, nous supposons que vous souhaitez les indexer et que toutes les erreurs d'analyse y sont importantes.

De plus, vous pouvez utiliser plusieurs extensions dans les fichiers Sitemaps (par exemple, pour les images, les vidéos, les actualités ou l'internationalisation), si vous le souhaitez. Ces extensions sont toutes facultatives.

Pour la plupart des sites Web, l'élément le plus visible des fichiers Sitemaps est que vous pouvez voir le nombre d'URL indexées. Cela peut prendre un jour ou deux pour apparaître. Par conséquent, si vous venez de soumettre un plan Sitemap pour la première fois, vous devrez peut-être être un peu patient. Alors que d'autres moyens (par exemple un site: -query) sont des approximations très très approximatives, ce nombre est extrêmement précis.

Ajoutons ceci: une autre chose que je trouve personnellement extrêmement utile en ce qui concerne les plans Sitemap est que, si vous ne les générez pas directement avec votre CMS, vous en apprendrez toujours beaucoup sur la façon dont votre site Web est explorable et sur le type d'URL découvertes. au cours de ce processus. J'ai souvent constaté que l'analyse d'un site Web avec un outil de votre côté (par exemple un générateur de plans Sitemap) génèrerait des problèmes qui pourraient vous échapper, tels que les identifiants de session dans les URL, le contenu dupliqué par le biais de différences d'URL, calendriers sans fin), ou même des parties d’un site qui ne sont pas liées du tout.

John Mueller
la source
Excellente info. J'ai aussi entendu dire qu'avec certains sites à fort trafic, il est préférable de ne pas utiliser de sitemap car Google effectue une meilleure analyse du travail. S'il manque quelque chose dans votre sitemap, il risque de ne plus être indexé.
Chris_O
3
@Chris_O Vous mélangez différents problèmes. Dans cet exemple, ce n’est pas que Google effectue lui-même une "meilleure" analyse; le plan du site lui-même est défectueux. Ce n'est pas une argumentation directe pour "n'utilisez pas de sitemap du tout". La solution à cette situation consiste à réparer le plan du site. De plus, les sitemaps sont informatifs, pas des directives. Quelque chose manque dans un sitemap ne signifie pas que Google ne le trouvera pas tout seul ou ne l'ignorera pas.
Sam '30
Le site en question compte plus de 40 000 pages indexées et le nouveau contenu est indexé en moins de 5 minutes (sans plan du site). Sur la base de votre réponse, nous allons commencer à les construire et à les diviser en années.
Chris_O
@ john-mueller salut mr. m. - j’ai soumis un sitemap de test avec 1 000 URL, nous avons récupéré un nombre d’index d’environ 700, nous avons maintenant testé les 1 000 URL via le site: www.complete.org/url/to/the/page.html, nous sommes revenus. un compte bien en dessous des 700 urls (plus dans la région 200). Qu'est-ce que ça veut dire?
Franz
2
@Franz Il y a parfois des détails impliqués qui rendent difficile la reproduction du nombre d'URL indexées avec le site: -queries. Par exemple, dans certains cas, nous pouvons combiner plusieurs URL et n'en afficher qu'une pour un site: -query. Donc, si vous voyez une différence, cela ne vaut généralement pas la peine de s’inquiéter.
John Mueller
6

Si vous ne recevez aucune erreur, vous pouvez en déduire que Google l'a analysée et en connaît le contenu. Mais cela ne signifie pas qu'ils vont explorer et / ou indexer ces pages. Les sitemaps ne sont qu'un autre moyen de faire connaître vos pages aux moteurs de recherche. Ils ne sont pas obligés d'explorer et d'indexer ces pages. Il en va de même pour ceux qui trouvent des pages via des liens ou des soumissions d'URL.

John Conde
la source
1
En tant qu'informations supplémentaires, il est assez facile de voir si Google comprend le plan du site. Vérifiez sous Optimisations -> Plans Sitemap. Il vous dira combien d'URL ont été soumises dans le sitemap. Le plan du site est lu avec succès le contenu et a trouvé cela de nombreux liens. Le deuxième chiffre indique combien ont été indexés et, comme le souligne John, il appartient à Google de déterminer s'ils en trouvent aucun, une partie ou la plus grande partie de votre contenu. Il sera toujours inférieur au montant soumis. Google trouve que certaines pages ne sont pas aussi chaudes et ne les dérangent pas.
Fiasco Labs
1

Google fait généralement un bon travail d'exploration de votre site Web si vous avez un bon nombre de liens de qualité. Si vous passez beaucoup de temps à regarder le nombre de pages que vous avez indexées, je vous suggère de mieux améliorer votre site et d’obtenir des liens de qualité.

David Urmann
la source
0

Peut-être un outil de validation de plan de site comme celui-ci , bien que je n’aie jamais "non" vu le plan de site commencer à entrer en jeu.


la source
Le fichier a déjà été validé. Ce n'est pas la question.
mardi
0

Pour les sites Web plus volumineux, par exemple des sites contenant des centaines, des milliers ou des millions de pages, c'est très utile. Le site de notre entreprise contenait 400 000 pages où les URL étaient créées de manière dynamique par ID de contenu et les paramètres d’URL étaient utilisés avec &, Les Outils pour les webmasters de Google vous fourniront des informations sur les pages analysées et vous montreront les erreurs. voyez par vous-même ce qui ne va pas. De cette façon, Google nous a réellement aidés à créer un meilleur site Web et nous a évité un énorme embarras à quelques reprises.

Il est également utile de voir le nombre de pages indexées par rapport au nombre de pages explorées.

Pour les sites Web plus petits, si le site Web est un petit groupe de pages .html où chaque page est liée via un menu et que le site n'est pas mis à jour fréquemment, si vous téléchargez un plan Sitemap, rien ne changera en fonction des résultats de recherche. Vous n'aurez aucun avantage à avoir un sitemap téléchargé par rapport à quelqu'un qui n'a pas téléchargé de sitemap.

Auparavant, j’avais environ 20 petits sites Web sur lesquels j’avais automatiquement des plans du site générés par le script cron et j’avais cessé de le faire. Un jour, j’ai découvert que les fichiers XML ne sont pas générés correctement depuis environ 6 mois, mais Google a heureusement ignoré mon erreur et a indexé ces sites Web de manière exhaustive, même lorsque les sitemaps contenaient des erreurs. Google utilise sitemap comme un indice idéal très sérieusement.

Mike
la source