J'ai un plan du site qui est généré quotidiennement avec beaucoup de liens vers des pages de produits. Ces produits sont importés quotidiennement à partir d'une autre source de données. Parce que la mise à jour consiste à jeter toutes les informations produit actuelles et à les remplacer par les nouvelles informations importées, la dernière date modifiée saute toujours d'un jour. Ceci est également utilisé dans le plan du site. Même pour les produits qui n'ont pas changé. Toutes les pages produits prétendent avoir été mises à jour.
Google pénalisera-t-il le site Web pour avoir prétendu que les pages ont changé de jour en jour alors qu'elles ne l'ont pas été?
Ma solution serait de ne modifier l'entrée que si les nouvelles données de produit importées diffèrent des données précédentes. Je veux juste m'assurer que c'est une mise à niveau utile à faire, alors que je pourrais également passer mon temps sur d'autres améliorations.
la source
Je n'ai jamais aimé l'idée de mettre à jour
<lastmod>
tous les jours car ce n'est pas seulement faux, c'est trompeur pour les moteurs de recherche.Dans un article sur SO , Gary Illyes de Google a écrit:
J'ai généralement préconisé une utilisation
<lastmod>
correcte ou pas du tout. Le laisser (ainsi que<changefreq>
&<priority>
) rend même le fichier lui-même plus petit et plus rapide pour les moteurs de recherche.la source
Non. Google utilisera
lastmod
un indice (identique à toutes les valeurs de sitemap), mais s'il décide que votre contenu n'est pas mis à jour quotidiennement, il l'ignorera simplement et revisitera vos pages selon son propre calendrier.la source
Je ne travaille pas pour Google et je ne peux pas dire avec certitude ce qu'ils font réellement, mais la manière judicieuse pour eux de traiter les
<lastmod>
horodatages serait de donner des conseils pour ne pas perdre de temps à ré-explorer des pages qui n'ont pas changé.Donc, si vous signalez toutes vos pages comme modifiées chaque jour, Googlebot continuera à explorer toutes vos pages dans l'ordre où elles se trouvent, plutôt que de se concentrer uniquement sur les pages qui ont changé. En fait, c'est comme si vous n'aviez signalé aucun horodatage de dernière modification.
La raison principale pour fournir des
<lastmod>
horodatages corrects est d'apporter des modifications à votre site plus rapidement dans l'index de Google. Si vous avez des centaines de pages sur votre site, il faudra un certain temps à Google pour les explorer toutes et trouver les modifications. Cependant, si vous dites à Googlebot quelles pages ont changé récemment, il peut d'abord explorer ces pages et éviter de perdre autant de temps sur le reste.Bien sûr, vous pouvez simplement augmenter le taux d'exploration de Googlebot dans les outils pour les webmasters et espérer le meilleur. Mais vraiment, il ne devrait pas être trop difficile de faire en sorte que votre script de mise à jour conserve les horodatages. Par exemple, je suppose que vous faites actuellement quelque chose comme ceci:
Si oui, remplacez-le par quelque chose comme ceci à la place:
la source
Non, il ignore simplement les informations que vous avez fournies lorsqu'elles sont incorrectes. Dans ce cas, les robots d'indexation Web déterminent eux-mêmes la fréquence à laquelle ils doivent explorer vos pages.
la source
Google ne vous pénalisera pas pour cela. Afin d'obtenir une pénalité, vous devez vraiment porter un chapeau noir sur le cul de Google, alors ne vous inquiétez pas. Google saura assez tôt si votre contenu a changé (c'est ce sur quoi ils ont travaillé ces dernières années) et utilisera la propriété lastmod comme indice.
la source
Je vous suggère de lire ces meilleures pratiques pour les plans de site XML et les flux RSS / Atom
la source