Pourquoi les moteurs de recherche affichent-ils souvent un nombre trop grand de résultats totaux? [fermé]

0

Chaque fois que vous essayez de rechercher quelque chose dans Google ou tout autre moteur de recherche .. Ils incluent le nombre total de résultats de recherche qui dépasse toujours la valeur numérique simple / lisible.

Où que soit le fait que vous puissiez (éventuellement) découvrir, il n’existe que peu de résultats de ce type, à l’exclusion de tous les liens dupliqués.

Est-il vraiment nécessaire pour eux de mentir et de faire de la fausse publicité?

Je voudrais aussi marquer une dernière question ici ..
comment se débarrasser des liens en double dans les résultats de recherche ..?

InfantPro'Aravind '
la source
Avez-vous un exemple de requête de recherche où cela est évident?
Georg Schölly

Réponses:

7

Les moteurs de recherche tels que Google n'évaluent pas vraiment la requête. Ils évaluent la première partie de la requête, ce qui signifie suffisamment de résultats pour afficher la première page de résultats.

En effet, Google travaille dans des contraintes de temps et doit donner un résultat en quelques secondes, alors que pour certains mots clés, des ensembles de résultats pointent vers des millions (ou plus) de pages indexées.

Le nombre total indiqué par Google pour le résultat n'est qu'une estimation statistique. Elle est évaluée en fonction du nombre de résultats trouvés et de la fraction que le résultat affiché représente de la taille totale des index à traiter pour tous les mots-clés. En d'autres termes, si vous fournissez les 20 premiers résultats, 20% des ensembles d'index sont traités, Google arrête le traitement et renvoie une estimation pour une taille de résultat totale de 100.

Lorsque vous cliquez sur un résultat, vous risquez de ne pas trouver votre mot-clé à l'intérieur. En effet, bien que Google réindexe toutes les pages, la récupération de milliards de pages Web prend beaucoup de temps. Donc, si la page a changé, Google peut être en retard de plusieurs mois pour prendre connaissance du changement.

harrymc
la source
Je ne peux même pas commenter là-dessus .. merci pour la réponse .. la meilleure réponse .. :-)
InfantPro'Aravind '11
3

Ce qui suit est une simplification excessive, mais c'est assez proche:

Parce qu'il y a tellement de pages sur Internet, il n'est même pas possible de toutes les stocker sur un seul serveur. Pour résoudre ce problème, Google dispose de plusieurs milliers de robots qui explorent tous le Web et stockent leurs résultats sur des serveurs. Cela signifie que les pages renvoyées pour votre requête sont dispersées sur des milliers de serveurs et que (si plusieurs robots ont accédé à la même page), la même page sera sur plusieurs serveurs.

Lorsque vous effectuez votre requête, Google demande à ses serveurs combien de pages ils correspondent. Mais comme il y a tellement de serveurs, il n’a pas le temps de regarder les résultats exacts de chacun. Ainsi, il obtient les dix premiers résultats et leur demande simplement de renvoyer un nombre indiquant le nombre de fois qu’ils en disposent.

Cela signifie que si le serveur n ° 1 a la page A et que le serveur n ° 10 a également la page A, Google l'indique sous deux résultats. Ou si 10 000 serveurs ont la page A, Google indique que 10 000 résultats! Ces résultats « faux » disparaissent lorsque vous cliquez pour voir plus de résultats, parce que quand il présente les dix résultats détaillés pour vous, Google ne se assurer qu'il n'y a pas de doublons.

J'espère que cette explication a un sens.

Je ne suis pas sûr de comprendre votre deuxième question. Google "déduit" les liens par défaut, il ne devrait donc jamais afficher le même lien deux fois dans le même résultat.

Arkaaito
la source
Je crois que c'est faux: Google ne consulte aucun sous-serveur. Chaque cluster google est autonome.
harrymc
1
Très bien. Je décris cela à partir de l’expérience acquise avec un autre grand moteur de recherche qui doit rester anonyme. Je n'ai pas de connaissance directe de l'architecture de Google (et j'aurais dû le mentionner aussi dans mon message d'origine). Mais alors, pouvez-vous préciser un peu plus ce qui cause réellement ce phénomène avec Google? [Je définirais mon message sur wiki, mais je ne pense pas avoir cette possibilité sur ce site ...] La déclaration officielle de Google à l' adresse google.com/support/webmasters/bin/… n'explique aucun des détails.
Arkaaito
Voir ma réponse. [15chars]
harrymc
Les autres commentaires importent peu. Cela a fait un point un peu sensible ici ..
InfantPro'Aravind '11