J'ai configuré Blogger avec le panneau Archive du blog affiché sur chaque page afin que les utilisateurs puissent facilement accéder aux anciens messages. Le problème est qu'il répertorie le titre de chaque page de ce panneau, ce qui signifie que la page actuelle obtient des mots-clés qui ne lui sont pas directement liés mais à une page différente.
Par exemple, j'écris peut-être sur les oranges, mais il y a une semaine, j'écrivais sur les pommes. La page sur les oranges est maintenant vue par les moteurs de recherche pour parler également des pommes car il y a un lien dans le panneau Archive vers mon article d'il y a une semaine sur les pommes. L'inverse est également vrai lorsque la page des pommes indexe également les mots-clés orange.
Existe-t-il un moyen d'exclure une certaine section d'une page de l'indexation? (par exemple, comme avoir un tout <div>
marqué noindex
ou quelque chose de similaire.)
Je sais que Blogger a la possibilité de supprimer le titre des pages dans le panneau d'archives, mais je préférerais qu'elles restent là pour que les utilisateurs sachent quels messages sont disponibles.
Réponses:
Soi-disant, vous pouvez ajouter la classe
robots-nocontent
aux éléments de votre page, comme ceci:Yahoo respecte cela , mais je ne sais pas si d'autres moteurs de recherche le respectent. Il semble que Google ne le prenne pas en charge pour le moment. Je soupçonne que si vous chargez votre contenu via ajax, vous obtiendrez le même effet s'il n'est pas présent sur la page.
la source
Il n'y a aucun moyen général de le faire et personnellement, je ne m'embêterais pas avec ça. Les moteurs de recherche sont assez bons pour reconnaître le contenu pertinent sur une page, et même si ce contenu peut apparaître dans les mots clés que les moteurs de recherche ont trouvés, cela ne signifie pas que cela rendrait la page pertinente pour ces mots clés.
Si vous avez une page sur "Fish" et une page sur "Dogs" (qui a le lien vers la page sur "Fish" quelque part dans la barre latérale), les moteurs de recherche pourront généralement reconnaître que la page sur "Fish" est beaucoup plus pertinent pour "Fish" que la page sur "Dogs" qui mentionne "Fish" dans la barre latérale. Il est possible que les deux pages soient trouvées à un moment donné, mais généralement, étant donné que la plupart des pages du site sont affichées dans les résultats de la recherche, cela ne vaut pas la peine de s'inquiéter.
Il n'est pas nécessaire d'être sophistiqué avec cela, et les moteurs de recherche sont susceptibles de devenir plus confus si vous essayez (par exemple, si vous utilisez JavaScript pour masquer le contenu, vous ne savez jamais quand les moteurs de recherche commenceront à trouver ce contenu malgré tout). De même, l'utilisation d'iframes avec robots.txt n'autorise pas ou AJAX dégradera fréquemment la qualité de vos pages pour les utilisateurs (ralentir ou les rendre moins utilisables sur une variété d'appareils), donc à moins qu'il n'y ait une raison très, très forte et prouvée que vous devez le faire, je vous recommande fortement de ne pas vous en préoccuper.
la source
Je pense que vous pouvez utiliser un iFrame et le code qu'il contient ne sera indexé que si vous laissez Google indexer cette page. Donc, si vous mettez un nofollow dans votre fichier robots.txt pour le fichier qui est chargé depuis l'iFrame, vous devriez être ok.
la source
Le texte du mot clé dans un lien est principalement appliqué à la page vers laquelle le lien pointe, et non à la page sur laquelle se trouve le lien. Personnellement, je ne m'en inquiéterais pas trop. Vous seriez probablement plus mal en supprimant / masquant les titres qu'en le laissant faire.
la source
Google propose sa propre façon d' exclure le texte indésirable de l'index .
Dans votre exemple, vous avez parlé de l'ancre, que Google propose cet exemple:
Et il y a quelques autres modes.
la source