Pourquoi les moteurs de recherche n'indexent-ils pas mon contenu?

29

Ceci est un général, wiki communautaire fourre-tout question et une paire de réponse destinée à répondre à toute question concernant les raisons pour lesquelles un contenu du site ou le site spécifique ne figurent pas dans les résultats des moteurs de recherche.

Si votre question a été fermée en double de cette question et que vous estimez que les informations fournies ici ne fournissent pas une réponse suffisante, veuillez ouvrir une discussion sur Pro Webmasters Meta .

Mon site (ou des pages spécifiques de mon site) n'apparaît pas dans les résultats des moteurs de recherche.

Pourquoi mon contenu n'est-il pas indexé et que puis-je faire à ce sujet?

danlefree
la source

Réponses:

36

Il existe un certain nombre de raisons pour lesquelles votre contenu peut ne pas apparaître dans les résultats des moteurs de recherche, cependant, il est important de noter que l' index d' un moteur de recherche peut contenir des pages qu'il n'affiche pas dans sa page de résultats .

Comment savoir si votre contenu est réellement indexé

Il peut être difficile de savoir si votre contenu est indexé.

  • Recherchez tous les documents de votre site et voyez combien sont répertoriés
    • Google: entrez site:example.com(où example.comest votre domaine, il ne doit pas y avoir d'espace après les deux points.)
    • Bing: entrezsite: example.com
    • Yahoo: entrez site: example.com(ou utilisez le formulaire de recherche avancée)
  • Recherchez un document spécifique par une phrase unique de huit à douze mots et recherchez cette phrase entre guillemets. Par exemple, pour trouver ce document, vous pouvez choisir de rechercher «nombre de raisons pour lesquelles votre contenu peut ne pas apparaître dans les résultats des moteurs de recherche»
  • En plus de ce qui précède, recherchez des mots clés à l'aide de inurl:et intitle:vous pouvez essayer quelque chose comme, keyword with another keyword inurl:example.comcela fera apparaître des pages qui ne sont indexées que pour le domaine spécifié.

    • Connectez-vous aux outils pour les webmasters pour voir les statistiques du moteur de recherche lui-même sur le nombre de pages indexées à partir du site
    • Outils Google pour les webmasters - Les informations sont disponibles sous "Santé" »" État de l'index ". Si vous avez soumis des plans de site, vous pouvez également voir combien de documents de chaque fichier de plan de site ont été indexés.
    • Outils Bing pour les webmasters

Dans certains cas, les documents peuvent ne pas être indexés via l'une de ces méthodes, mais les documents peuvent être trouvés dans l'index à l'aide d'autres méthodes. Par exemple, les outils pour les webmasters peuvent signaler que peu de documents sont indexés même lorsque vous pouvez rechercher leurs phrases et trouver les documents sur le moteur de recherche. Dans un tel cas, les documents sont effectivement indexés.

Comment le contenu est indexé

Avant d'indexer le contenu des moteurs de recherche, ils doivent le trouver à l'aide d'un robot d'indexation. Vous devriez vérifier les journaux de votre serveur Web pour voir si les robots des moteurs de recherche (identifiés par leur agent utilisateur - par exemple Googlebot , Bing / MSNbot ) visitent votre site.

Les moteurs de recherche plus grands comme Google et Bing explorent généralement les sites fréquemment, mais le robot peut ne pas être au courant des nouveaux sites. Vous pouvez informer les moteurs de recherche de l'existence de votre site en vous inscrivant en tant que webmaster ( Google Webmaster Tools , Bing Webmaster Tools ) ou, si le moteur de recherche ne fournit pas cette fonctionnalité, en soumettant un lien vers ses robots (par exemple Yahoo ).

Depuis combien de temps votre site / contenu est-il en ligne?

Les moteurs de recherche peuvent indexer le contenu très rapidement après sa découverte, mais ces mises à jour sont parfois retardées. Les moteurs de recherche plus petits peuvent également être beaucoup moins réactifs et prendre des semaines pour indexer un nouveau contenu.

Si votre contenu n'est en ligne que depuis plusieurs jours et ne contient aucun lien provenant d'autres sites (ou si ses liens proviennent de sites que les robots d'exploration ne visitent pas fréquemment), il n'est probablement pas indexé. Si votre site n'est pas en ligne depuis plus de quelques mois, les moteurs de recherche peuvent ne pas lui faire suffisamment confiance pour en indexer encore beaucoup de contenu.

Le contenu a-t-il été exclu par le webmaster?

Cette étape est particulièrement importante si vous reprenez un site à quelqu'un d'autre et qu'il y a un problème avec une page ou un répertoire spécifique: recherchez les exclusions robots.txt et META robots et supprimez-les si vous souhaitez que les robots d'exploration indexent le contenu exclu.

Un problème technique empêche-t-il l'indexation de votre contenu?

Si vous avez un site établi mais qu'un contenu spécifique n'est pas indexé (il n'y a pas de hits de robot d'indexation sur les URL où se trouve le contenu), les outils pour webmasters fournis par Google et Bing peuvent fournir des informations de diagnostic utiles.

La documentation des erreurs d'exploration de Google fournit des informations détaillées sur les problèmes courants des robots d'exploration Web qui empêchent l'indexation du contenu et, si vous utilisez les outils Google pour les webmasters, vous recevrez une alerte si l'un de ces problèmes est détecté sur votre site.

Corrigez les erreurs et les erreurs de configuration le plus rapidement possible pour vous assurer que tout le contenu de votre site est indexé.

Le contenu est-il de mauvaise qualité?

Les moteurs de recherche n'indexent pas la plupart des pages qu'ils explorent. Ils indexent uniquement le contenu de la plus haute qualité. Les moteurs de recherche n'indexeront pas le contenu si:

  • C'est du spam, du charabia ou un non-sens.
  • On le trouve ailleurs. Lorsque les moteurs de recherche trouvent du contenu en double, ils choisissent un seul des doublons à indexer. Habituellement, c'est l'original qui a plus de réputation et de liens.
  • C'est mince. Il a besoin de plus de quelques lignes de texte original. De préférence beaucoup plus. Les pages créées automatiquement avec peu de contenu, comme une page pour chacun de vos utilisateurs, sont peu susceptibles d'être indexées.
  • Il n'a pas assez de réputation ou de liens. Une page peut être enfouie trop profondément dans votre site pour être classée. Il est peu probable que toute page sans liens externes et plus de quelques clics à partir de la page d'accueil soit indexée.

Une partie de votre contenu est-elle indexée, mais pas tout?

Si votre site contient des centaines de pages, Google ne choisira presque jamais d'indexer chaque page. Si votre site contient des dizaines de milliers de pages, il est très courant que Google choisisse d'indexer seulement une petite partie de ces pages.

Google choisit le nombre de pages à indexer à partir d'un site en fonction de la réputation globale du site et de la qualité du contenu. Google indexe généralement un pourcentage plus important d'un site au fil du temps à mesure que la réputation du site augmente.

Stephen Ostermiller
la source
1

Je pense que je n'ai pas besoin de répéter la même chose que celle indiquée ci-dessus, mais si vous n'êtes pas familier avec le nouvel outil, voici le moyen de le vérifier ci-dessous.

Vous pouvez vérifier si votre fichier robots.txt ne bloque pas le contenu en allant ancien de Google Webmaster robots.txt Tester l' outil

entrez la description de l'image ici

Google Search Console (nouvelle version)

La console de recherche Google fournit des informations précieuses par rapport à l'ancienne version. Vérifiez les problèmes directement à partir de Google Search Console, que votre page soit explorée ou non, indexée ou non, en direct ou non et les problèmes éventuels.

  1. Connectez-vous à la Google Search Console de votre site Web
  2. Si vous possédez plusieurs propriétés de domaine, assurez-vous d'avoir sélectionné celle souhaitée.

Outil obsolète dans Google Webmaster

C'est obsolète maintenant

Voici comment vous pouvez parcourir la nouvelle Search Console

Nouvelle console de recherche Google

Deepak Mathur
la source
0

Si vous avez un fichier robots.txt dans votre répertoire racine, cela pourrait indiquer à Google de ne pas indexer votre site.

Avez-vous vérifié cela?

Habituellement, il est sûr de simplement supprimer (ou renommer) ces fichiers car il semble que vous VOULEZ être indexé.

IMPORTANT: cela peut être une rupture de contrat si vous essayez de faire fonctionner Google Adsense sur votre site.

Peu importe où vous mettez votre code spécial, si vous n'êtes pas indexé, vous serez informé que votre site est en panne afin qu'ils ne puissent pas le vérifier.

SDsolar
la source
Le fichier robots.txt possède un ensemble de règles défini par l'utilisateur à analyser ou non, donc le supprimer n'est pas une solution car il s'agit du premier fichier à analyser. La meilleure solution est de corriger les règles, de tester le fichier robots.txt, d'ajouter la directive sitemap dans votre robot.txt, de maintenir votre sitemap à jour avec lastmod et de changer les attributs de fréquence.
Deepak Mathur