Parce que ça ressemble à ça. Pour mes sites, nous interdisons le répertoire d'images et les aperçus sont toutes des images manquantes, ce qui donne au site un aspect bancal.
Est-ce le cas et existe-t-il un moyen d'autoriser uniquement le bot de prévisualisation à accéder aux images à l'aide de robots.txt?
EDIT: Il semble que les aperçus soient générés à la fois par le Google Bot normal et par un aperçu du Web Google à la volée, comme mentionné (brièvement) sur le blog du Webmaster Central .
En utilisant un site: la recherche et mon logiciel de surveillance, je pouvais voir quand le bot a frappé mon site et quand cela s'est produit, les images sont apparues très bien dans l'aperçu. Donc, je suppose que le robot normal ignore les images par robots.txt, mais le robot d'aperçu obtient les images de toute façon.
Cette implémentation semble un peu délicate car mes options semblent être:
- permettre à Google Bot d'explorer mes images (ce que je ne veux pas faire)
- utilisez la balise nosnippet qui bloque l'aperçu, mais également des extraits (ce que je ne veux pas faire)
- Laissez apparaître les aperçus bancaux qui peuvent avoir un impact négatif sur les clics
la source
Réponses:
Je pense que John Mueller avait raison dans les commentaires.
Je ne savais pas que vous pouviez autoriser Google à explorer du contenu sans l'indexer. J'ai mis sa technique en place et j'attends juste de me faire ramper pour voir si ça a marché.
J'accepterai cela comme réponse dans quelques jours, à moins que John ne veuille ajouter ses commentaires à la section des réponses afin qu'il puisse gagner le représentant.
la source
Comme la majeure partie de l'aperçu est effectuée par le robot d'exploration Google, le blocage de l'exploration d'une partie de votre site aura un impact sur l'aperçu ...
Pourquoi ne voulez-vous pas autoriser Google Bot à explorer vos images?
la source
Ce qui suit est une solution technique qui peut ou non simplement s'appliquer à votre site.
Il est possible (voire probable) que Google propose un moyen de le faire avec seulement quelques conseils dans les métadonnées ou le fichier robots.txt, mais d'ici là ...
Étape 1.
Créez un service / servlet de redirection pour les images de première page.
C'est à dire une URL comme
/frontpageimages/[image name]
qui fait une redirection côté serveur vers
/images/[image name]
Étape 2.
Faites réécrire tous les liens d'image sur votre page d'accueil (et uniquement la page d'accueil) pour passer par le service de redirection à partir de l'étape 1 plutôt que de vous lier directement à l'image.
Étape 3.
Assurez-vous que le fichier robots.txt permet à Googlebot d'explorer
/frontpageimages/
Cela devrait garantir que Google peut explorer toutes les images qu'il rencontre sur votre page d'accueil tout en laissant seules les images sur d'autres pages.
Bien que le service de redirection puisse (en théorie) être utilisé pour explorer toutes vos images sans violer techniquement votre robots.txt, ce n'est pas quelque chose que des robots bien comportés (comme googlebot) vont faire. Et les robots mal élevés ne vont pas se soucier de robots.txt.
la source