Il existe un certain nombre de raisons pour lesquelles votre contenu peut ne pas apparaître dans les résultats des moteurs de recherche, cependant, il est important de noter que l' index d' un moteur de recherche
peut contenir des pages qu'il n'affiche pas dans sa
page de résultats .
Comment savoir si votre contenu est réellement indexé
Il peut être difficile de savoir si votre contenu est indexé.
- Recherchez tous les documents de votre site et voyez combien sont répertoriés
- Google: entrez
site:example.com
(où example.com
est votre domaine, il ne doit pas y avoir d'espace après les deux points.)
- Bing: entrez
site: example.com
- Yahoo: entrez
site: example.com
(ou utilisez le formulaire de recherche avancée)
- Recherchez un document spécifique par une phrase unique de huit à douze mots et recherchez cette phrase entre guillemets. Par exemple, pour trouver ce document, vous pouvez choisir de rechercher «nombre de raisons pour lesquelles votre contenu peut ne pas apparaître dans les résultats des moteurs de recherche»
En plus de ce qui précède, recherchez des mots clés à l'aide de inurl:
et intitle:
vous pouvez essayer quelque chose comme, keyword with another keyword inurl:example.com
cela fera apparaître des pages qui ne sont indexées que pour le domaine spécifié.
- Connectez-vous aux outils pour les webmasters pour voir les statistiques du moteur de recherche lui-même sur le nombre de pages indexées à partir du site
- Outils Google pour les webmasters - Les informations sont disponibles sous "Santé" »" État de l'index ". Si vous avez soumis des plans de site, vous pouvez également voir combien de documents de chaque fichier de plan de site ont été indexés.
- Outils Bing pour les webmasters
Dans certains cas, les documents peuvent ne pas être indexés via l'une de ces méthodes, mais les documents peuvent être trouvés dans l'index à l'aide d'autres méthodes. Par exemple, les outils pour les webmasters peuvent signaler que peu de documents sont indexés même lorsque vous pouvez rechercher leurs phrases et trouver les documents sur le moteur de recherche. Dans un tel cas, les documents sont
effectivement indexés.
Comment le contenu est indexé
Avant d'indexer le contenu des moteurs de recherche, ils doivent le trouver à l'aide d'un
robot d'indexation.
Vous devriez vérifier les journaux de votre serveur Web pour voir si les robots des moteurs de recherche (identifiés par leur agent utilisateur - par exemple
Googlebot ,
Bing / MSNbot ) visitent votre site.
Les moteurs de recherche plus grands comme Google et Bing explorent généralement les sites fréquemment, mais le robot peut ne pas être au courant des nouveaux sites. Vous pouvez informer les moteurs de recherche de l'existence de votre site en vous inscrivant en tant que webmaster ( Google Webmaster Tools , Bing Webmaster Tools ) ou, si le moteur de recherche ne fournit pas cette fonctionnalité, en soumettant un lien vers ses robots (par exemple Yahoo ).
Depuis combien de temps votre site / contenu est-il en ligne?
Les moteurs de recherche peuvent indexer le contenu très rapidement après sa découverte, mais ces mises à jour sont parfois retardées. Les moteurs de recherche plus petits peuvent également être beaucoup moins réactifs et prendre des semaines pour indexer un nouveau contenu.
Si votre contenu n'est en ligne que depuis plusieurs jours et ne contient aucun lien provenant d'autres sites (ou si ses liens proviennent de sites que les robots d'exploration ne visitent pas fréquemment), il n'est probablement pas indexé. Si votre site n'est pas en ligne depuis plus de quelques mois, les moteurs de recherche peuvent ne pas lui faire suffisamment confiance pour en indexer encore beaucoup de contenu.
Le contenu a-t-il été exclu par le webmaster?
Cette étape est particulièrement importante si vous reprenez un site à quelqu'un d'autre et qu'il y a un problème avec une page ou un répertoire spécifique: recherchez les
exclusions robots.txt
et META robots et supprimez-les si vous souhaitez que les robots d'exploration indexent le contenu exclu.
Un problème technique empêche-t-il l'indexation de votre contenu?
Si vous avez un site établi mais qu'un contenu spécifique n'est pas indexé (il n'y a pas de hits de robot d'indexation sur les URL où se trouve le contenu), les outils pour webmasters fournis par Google et Bing peuvent fournir des informations de diagnostic utiles.
La
documentation des erreurs d'exploration de Google fournit des informations détaillées sur les problèmes courants des robots d'exploration Web qui empêchent l'indexation du contenu et, si vous utilisez les outils Google pour les webmasters, vous recevrez une alerte si l'un de ces problèmes est détecté sur votre site.
Corrigez les erreurs et les erreurs de configuration le plus rapidement possible pour vous assurer que tout le contenu de votre site est indexé.
Le contenu est-il de mauvaise qualité?
Les moteurs de recherche n'indexent pas la plupart des pages qu'ils explorent. Ils indexent uniquement le contenu de la plus haute qualité. Les moteurs de recherche n'indexeront pas le contenu si:
- C'est du spam, du charabia ou un non-sens.
- On le trouve ailleurs. Lorsque les moteurs de recherche trouvent du contenu en double, ils choisissent un seul des doublons à indexer. Habituellement, c'est l'original qui a plus de réputation et de liens.
- C'est mince. Il a besoin de plus de quelques lignes de texte original. De préférence beaucoup plus. Les pages créées automatiquement avec peu de contenu, comme une page pour chacun de vos utilisateurs, sont peu susceptibles d'être indexées.
- Il n'a pas assez de réputation ou de liens. Une page peut être enfouie trop profondément dans votre site pour être classée. Il est peu probable que toute page sans liens externes et plus de quelques clics à partir de la page d'accueil soit indexée.
Une partie de votre contenu est-elle indexée, mais pas tout?
Si votre site contient des centaines de pages, Google ne choisira presque jamais d'indexer chaque page. Si votre site contient des dizaines de milliers de pages, il est très courant que Google choisisse d'indexer seulement une petite partie de ces pages.
Google choisit le nombre de pages à indexer à partir d'un site en fonction de la réputation globale du site et de la qualité du contenu. Google indexe généralement un pourcentage plus important d'un site au fil du temps à mesure que la réputation du site augmente.
Je pense que je n'ai pas besoin de répéter la même chose que celle indiquée ci-dessus, mais si vous n'êtes pas familier avec le nouvel outil, voici le moyen de le vérifier ci-dessous.
Vous pouvez vérifier si votre fichier robots.txt ne bloque pas le contenu en allant ancien de Google Webmaster robots.txt Tester l' outil
Google Search Console (nouvelle version)
La console de recherche Google fournit des informations précieuses par rapport à l'ancienne version. Vérifiez les problèmes directement à partir de Google Search Console, que votre page soit explorée ou non, indexée ou non, en direct ou non et les problèmes éventuels.
Outil obsolète dans Google Webmaster
Voici comment vous pouvez parcourir la nouvelle Search Console
la source
Si vous avez un fichier robots.txt dans votre répertoire racine, cela pourrait indiquer à Google de ne pas indexer votre site.
Avez-vous vérifié cela?
Habituellement, il est sûr de simplement supprimer (ou renommer) ces fichiers car il semble que vous VOULEZ être indexé.
IMPORTANT: cela peut être une rupture de contrat si vous essayez de faire fonctionner Google Adsense sur votre site.
Peu importe où vous mettez votre code spécial, si vous n'êtes pas indexé, vous serez informé que votre site est en panne afin qu'ils ne puissent pas le vérifier.
la source