Images encodées en Base64 et disponibilité de leurs métadonnées pour Googlebot
9
Si j'intègre une image dans une page en tant que img- srcavec l'URI de données base64, les métadonnées de l'image (EXIF, IPTC, XMP) sont-elles toujours disponibles pour l'imagebot de Google?
Probablement pas. Googlebot a probablement besoin d'une URL à laquelle il peut classer et renvoyer les utilisateurs.
John Conde
1
Oubliez les données EXIF, je ne suis même pas sûr que les images Google indexeraient même une image qui n'a pas sa propre URL.
Stephen Ostermiller
@StephenOstermiller: telle est la question: s'il indexe de telles images, il lit aussi EXIF
Evgeniy
@Evgeniy Comme le souligne Stephen, les URI de données ne sont pas séparés de leur document contenant (voir ceci pour plus d'informations). Les moteurs de recherche indexent les URL, donc seul le document contenant serait indexé, et s'ils indexeraient les métadonnées contenues dans un URI de données (si en effet il contenait cela aussi, le rendant encore plus grand) est un point muet. Pour confirmation, vous pouvez utiliser un moteur de recherche de code source pour rechercher un URI de données, puis voir si cette image a été indexée et contenait des informations EXIF dans Google. Cela semble cependant très improbable.
dan
@Evgeniy Notez que la publication croisée de la même question sur plusieurs sites Stack Exchange n'est pas tolérée.
dan
Réponses:
6
Google n'indexe pas les images URI de données pour la recherche d'images Google. John Mueller de Google le dit ici et dans les commentaires ci-dessous. Étant donné que les images URI de données ne sont pas indexées dans la recherche d'images Google, les données EXIF qu'elles contiennent ne sont pas pertinentes.
Vous pouvez vérifier que ces images ne sont pas indexées. J'ai recherché sur Google images "data uri" et vérifié les résultats. Toutes les images que j'ai consultées étaient des fichiers image, pas une URI d'image encodée en base64. On pourrait penser que si Google était capable d'indexer des images d'URI de données, certaines d'entre elles apparaîtraient dans les résultats de recherche pour ce terme.
Si jamais Google décide d'indexer des images d'URI de données, il devrait pouvoir obtenir les données EXIF. Uri de données est le fichier entier codé en base64 (pas d'espaces ni de nouvelles lignes) avec un data:image/png;base64,préfixe. Toutes les métadonnées du fichier seraient toujours présentes dans la version URI des données codées en base64.
J'utilise des images URI de données sur l'un de mes sites Web. Je le fais parce que les utilisateurs consultent généralement une seule page du site pour obtenir toutes les informations dont ils ont besoin. L'inclusion de toutes les données CSS, JS et d'images en ligne dans la page améliore considérablement les performances. Les images sont toutes petites, donc la technique fonctionne particulièrement bien.
Mon site reçoit une bonne quantité de trafic d'Internet Explorer 7 et versions antérieures qui ne prennent pas en charge les images URI de données. Je dois donc les servir conditionnellement. J'ai également les images sur le serveur et je choisis des URL d'images régulières ou l'URI de données en fonction de l'en- User-Agenttête. Je traite les bots (y compris Googlebot) de la même manière que IE 7, c'est-à-dire que je sers les images comme des URL HTTP. Je le fais parce que l'inclusion d'images uri de données augmente considérablement la taille de la page. La plupart des bots n'ont pas besoin de télécharger les images, c'est donc plus efficace pour eux. J'avais également remarqué que Google Webmaster Tools a signalé que Googlebot explorait mon site beaucoup plus lentement avec des images URI de données activées pour cela. Cela pourrait techniquement être considéré comme une dissimulation, mais ce serait un moyen d'indexer vos images URI de données.
La chaîne codée @StephenOstermiller peut contenir des espaces: goo.gl/RF8r07 . je vais remplir une image avec EXIF, la coder, la publier et la regarder, qu'elle entre dans l'index.
Evgeniy
3
John Mueller (de Google) indique ici que Google n'indexe généralement pas les images des URI de données. De nombreux outils en ligne utilisés pour coder ces derniers suppriment également les métadonnées, donc cela dépend vraiment de la façon dont elles sont codées pour savoir si les informations EXIF sont conservées ... mais étant donné qu'elles ne sont pas indexées de toute façon, c'est un point discutable. Faites-nous savoir vos résultats (assurez-vous de ne pas laisser l'URL de l'image indexée - Google utilise également la reconnaissance d'image afin que les informations EXIF puissent être utilisées à partir des images correspondantes).
dan
1
@dan merci! votre lien vers la réponse de John Muellers efface beaucoup de choses maintenant à la fois! Si G n'indexe pas les images, où il ne peut pas obtenir d'URI, il n'est donc pas nécessaire de se demander si l'EXIF est laissé à l'intérieur ou non.
Evgeniy
3
Comme indiqué ci-dessus, nous ne les indexons actuellement pas séparément en tant qu'images. Cela pourrait changer à l'avenir, mais au moins pour le moment, vous voudrez utiliser des URL d'images distinctes si vous voulez que ces images soient indexées dans la recherche d'images.
John Mueller
2
Bien que Google utilise des images comme URI de données encodées en base64 sur son propre SERP, il n'indexe pas ces images sur d'autres sites Web. Merci à @dan, qui m'a dirigé vers la discussion Google Groupes, où John Mueller explique ce problème . Cela signifie également que la question de l'existence de données EXIF dans de telles images n'est pas pertinente.
Cette explication montre clairement à quelles images cette technique d'optimisation des performances est préférable d'appliquer: les petites images, comme les icônes, les favicons et les boutons, et ces images, qui n'apportent aucune valeur supplémentaire au contenu du site.
Sur l'autre site, si l'on doit catégoriquement incorporer une image AVEC une valeur de contenu supplémentaire en tant qu'URI de données encodées en base64, la seule meilleure pratique pour fournir les métadonnées de l'image est d'utiliser le balisage de Schema.org, où il est possible de négocier des données EXIF, par exemple avec ce sorte de balisage.
Un autre type de balisage prometteur pour négocier des données ressemblant à «propriété: valeur», comme EXIF, a actuellement un statut de proposition. Mais cet article du blog de Google montre des extraits structurés, qui peuvent être générés par la proposition de balisage que j'ai liée ci-dessus.
Réponses:
Google n'indexe pas les images URI de données pour la recherche d'images Google. John Mueller de Google le dit ici et dans les commentaires ci-dessous. Étant donné que les images URI de données ne sont pas indexées dans la recherche d'images Google, les données EXIF qu'elles contiennent ne sont pas pertinentes.
Vous pouvez vérifier que ces images ne sont pas indexées. J'ai recherché sur Google images "data uri" et vérifié les résultats. Toutes les images que j'ai consultées étaient des fichiers image, pas une URI d'image encodée en base64. On pourrait penser que si Google était capable d'indexer des images d'URI de données, certaines d'entre elles apparaîtraient dans les résultats de recherche pour ce terme.
Si jamais Google décide d'indexer des images d'URI de données, il devrait pouvoir obtenir les données EXIF. Uri de données est le fichier entier codé en base64 (pas d'espaces ni de nouvelles lignes) avec un
data:image/png;base64,
préfixe. Toutes les métadonnées du fichier seraient toujours présentes dans la version URI des données codées en base64.J'utilise des images URI de données sur l'un de mes sites Web. Je le fais parce que les utilisateurs consultent généralement une seule page du site pour obtenir toutes les informations dont ils ont besoin. L'inclusion de toutes les données CSS, JS et d'images en ligne dans la page améliore considérablement les performances. Les images sont toutes petites, donc la technique fonctionne particulièrement bien.
Mon site reçoit une bonne quantité de trafic d'Internet Explorer 7 et versions antérieures qui ne prennent pas en charge les images URI de données. Je dois donc les servir conditionnellement. J'ai également les images sur le serveur et je choisis des URL d'images régulières ou l'URI de données en fonction de l'en-
User-Agent
tête. Je traite les bots (y compris Googlebot) de la même manière que IE 7, c'est-à-dire que je sers les images comme des URL HTTP. Je le fais parce que l'inclusion d'images uri de données augmente considérablement la taille de la page. La plupart des bots n'ont pas besoin de télécharger les images, c'est donc plus efficace pour eux. J'avais également remarqué que Google Webmaster Tools a signalé que Googlebot explorait mon site beaucoup plus lentement avec des images URI de données activées pour cela. Cela pourrait techniquement être considéré comme une dissimulation, mais ce serait un moyen d'indexer vos images URI de données.la source
Bien que Google utilise des images comme URI de données encodées en base64 sur son propre SERP, il n'indexe pas ces images sur d'autres sites Web. Merci à @dan, qui m'a dirigé vers la discussion Google Groupes, où John Mueller explique ce problème . Cela signifie également que la question de l'existence de données EXIF dans de telles images n'est pas pertinente.
Cette explication montre clairement à quelles images cette technique d'optimisation des performances est préférable d'appliquer: les petites images, comme les icônes, les favicons et les boutons, et ces images, qui n'apportent aucune valeur supplémentaire au contenu du site.
Sur l'autre site, si l'on doit catégoriquement incorporer une image AVEC une valeur de contenu supplémentaire en tant qu'URI de données encodées en base64, la seule meilleure pratique pour fournir les métadonnées de l'image est d'utiliser le balisage de Schema.org, où il est possible de négocier des données EXIF, par exemple avec ce sorte de balisage.
Un autre type de balisage prometteur pour négocier des données ressemblant à «propriété: valeur», comme EXIF, a actuellement un statut de proposition. Mais cet article du blog de Google montre des extraits structurés, qui peuvent être générés par la proposition de balisage que j'ai liée ci-dessus.
la source