Un fichier Sitemap aide les moteurs de recherche à découvrir les URL nouvelles et mises à jour sur votre site Web. En particulier, si votre site Web est assez volumineux, cela peut les aider à se concentrer sur le contenu nouveau et mis à jour, au lieu d’avoir à parcourir aveuglément tout pour voir si quelque chose a changé. Cela peut permettre de trouver le nouveau contenu beaucoup plus rapidement, ce qui peut être assez remarquable, surtout si le site est plus grand ou plus complexe.
Avec Google en particulier (je travaille chez Google; je ne sais pas comment les autres moteurs de recherche traitent ces problèmes), il effectue également les tâches suivantes:
- Trouvez le nombre d'URL indexées pour votre site Web: Ces statistiques sont recalculées quotidiennement et très précisément. Vous pouvez les trouver dans la page de détail des sitemaps .
- Détectez les problèmes de canonisation: si les numéros ne correspondent pas , cela signifie souvent que vous indiquez dans le fichier Sitemap des URL ne correspondant pas à celles trouvées lors de notre analyse. C'est généralement un signe que vous devez travailler sur la canonisation .
- Aide à la canonisation: lorsque nous trouverons sur votre site plusieurs URL affichant un contenu identique, nous attribuerons à toute URL figurant dans un plan Sitemap un avantage supplémentaire, même si vous n'utilisez pas d'autres méthodes de canonisation.
- Rechercher des parties de votre site mal indexées: ces nombres sont fournis par fichier Sitemap. Vous pouvez ainsi créer des fichiers Sitemap distincts pour les sections logiques de votre site, afin de découvrir les zones dans lesquelles Google n'indexe pas autant que vous le souhaitez.
- Hiérarchisez les erreurs d'analyse: dans la section Erreurs d'analyse , les URL spécifiées dans les fichiers Sitemaps sont répertoriées séparément. Étant donné que vous avez spécifiquement fourni ces URL, nous supposons que vous souhaitez les indexer et que toutes les erreurs d'analyse y sont importantes.
De plus, vous pouvez utiliser plusieurs extensions dans les fichiers Sitemaps (par exemple, pour les images, les vidéos, les actualités ou l'internationalisation), si vous le souhaitez. Ces extensions sont toutes facultatives.
Pour la plupart des sites Web, l'élément le plus visible des fichiers Sitemaps est que vous pouvez voir le nombre d'URL indexées. Cela peut prendre un jour ou deux pour apparaître. Par conséquent, si vous venez de soumettre un plan Sitemap pour la première fois, vous devrez peut-être être un peu patient. Alors que d'autres moyens (par exemple un site: -query) sont des approximations très très approximatives, ce nombre est extrêmement précis.
Ajoutons ceci: une autre chose que je trouve personnellement extrêmement utile en ce qui concerne les plans Sitemap est que, si vous ne les générez pas directement avec votre CMS, vous en apprendrez toujours beaucoup sur la façon dont votre site Web est explorable et sur le type d'URL découvertes. au cours de ce processus. J'ai souvent constaté que l'analyse d'un site Web avec un outil de votre côté (par exemple un générateur de plans Sitemap) génèrerait des problèmes qui pourraient vous échapper, tels que les identifiants de session dans les URL, le contenu dupliqué par le biais de différences d'URL, calendriers sans fin), ou même des parties d’un site qui ne sont pas liées du tout.
Si vous ne recevez aucune erreur, vous pouvez en déduire que Google l'a analysée et en connaît le contenu. Mais cela ne signifie pas qu'ils vont explorer et / ou indexer ces pages. Les sitemaps ne sont qu'un autre moyen de faire connaître vos pages aux moteurs de recherche. Ils ne sont pas obligés d'explorer et d'indexer ces pages. Il en va de même pour ceux qui trouvent des pages via des liens ou des soumissions d'URL.
la source
Google fait généralement un bon travail d'exploration de votre site Web si vous avez un bon nombre de liens de qualité. Si vous passez beaucoup de temps à regarder le nombre de pages que vous avez indexées, je vous suggère de mieux améliorer votre site et d’obtenir des liens de qualité.
la source
Peut-être un outil de validation de plan de site comme celui-ci , bien que je n’aie jamais "non" vu le plan de site commencer à entrer en jeu.
la source
Pour les sites Web plus volumineux, par exemple des sites contenant des centaines, des milliers ou des millions de pages, c'est très utile. Le site de notre entreprise contenait 400 000 pages où les URL étaient créées de manière dynamique par ID de contenu et les paramètres d’URL étaient utilisés avec &, Les Outils pour les webmasters de Google vous fourniront des informations sur les pages analysées et vous montreront les erreurs. voyez par vous-même ce qui ne va pas. De cette façon, Google nous a réellement aidés à créer un meilleur site Web et nous a évité un énorme embarras à quelques reprises.
Il est également utile de voir le nombre de pages indexées par rapport au nombre de pages explorées.
Pour les sites Web plus petits, si le site Web est un petit groupe de pages .html où chaque page est liée via un menu et que le site n'est pas mis à jour fréquemment, si vous téléchargez un plan Sitemap, rien ne changera en fonction des résultats de recherche. Vous n'aurez aucun avantage à avoir un sitemap téléchargé par rapport à quelqu'un qui n'a pas téléchargé de sitemap.
Auparavant, j’avais environ 20 petits sites Web sur lesquels j’avais automatiquement des plans du site générés par le script cron et j’avais cessé de le faire. Un jour, j’ai découvert que les fichiers XML ne sont pas générés correctement depuis environ 6 mois, mais Google a heureusement ignoré mon erreur et a indexé ces sites Web de manière exhaustive, même lorsque les sitemaps contenaient des erreurs. Google utilise sitemap comme un indice idéal très sérieusement.
la source