Que ne pouvez-vous PAS trouver sur Google? [fermé]

18

Google prétend être juste, et il est dans l'intérêt de la société (la plupart du temps) de parcourir Internet pour tout et tout ce à quoi ses araignées peuvent accéder. Je veux savoir:

  • Quel type de contenu (accessible au public) Google ne parvient-il pas à fournir?
  • Existe-t-il un type de contenu spécifique que Google ne peut pas récupérer?

Les références, en particulier à la propre documentation de Google, seraient particulièrement impressionnantes.

samthebrand
la source
Maintenant que l'UE a promulgué un «droit à l'oubli», il y a beaucoup de choses que nous ne pourrons plus trouver. Voici certaines choses qui ont été «oubliées».
samthebrand

Réponses:

21

Quelques idées sur le type de choses:

  1. Le contenu explicitement interdit par le robots.txtfichier d' un domaine est exclu de l'index Google.
  2. Sites Web qui ne sont pas liés à d'autres sites Web que Google connaît déjà. Autrement dit, il existe probablement de nombreux sites Web qui ne sont pas liés à partir de pages visibles, ces sites Web ne seront jamais trouvés par l'araignée Google à moins qu'ils ne soient soumis manuellement à Google via les outils pour les webmasters .
  3. Sites Web qui se trouvent derrière des formulaires Web que vous devez remplir.
  4. Images de recensement. Étant donné que le contenu est des images qui sont souvent indexées manuellement, elles se trouvent généralement sur des sites payants comme ancestry.com.

En savoir plus sur le Deep Web

amh
la source
2
Point 2 ce n'est pas vrai. Vous pouvez soumettre un site à Google via les outils pour les webmasters , et il sera indexé même s'il n'est pas lié à partir d'autres sites Web.
Alex
C'est vrai. Bonne clarification.
2012
3
En fait, je ne suis pas d'accord avec le deuxième point. J'avais un serveur Web de test sur mon PC et il a été indexé. J'ai trouvé cela en vérifiant le journal d'accès.
Bakudan
2
J'ai enregistré de nouveaux domaines, commencé à les développer et trouvé Googlebot les explorant quelques jours plus tard. Je pensais que c'était un peu effrayant jusqu'à ce que je réalise - je ne suis peut-être pas la première personne à posséder ce domaine :) Ils ne divulguent pas de détails, mais je suis sûr qu'ils gardent une trace des domaines que les gens jugeaient suffisamment importants pour s'inscrire et au moins quelques-uns ont visité à un moment donné, au moins pendant une certaine période de temps.
Tim Post
6

Mis à part Twitter, Google n'indexe pas très bien Tumblr . Les articles de blog sur Tumblr sont plus faciles à trouver en utilisant la recherche Tumblr. De plus, tout sur Google Sites n'est pas (ou est à peine) indexé. Si vous démarrez un site Google, obtenez votre propre domaine.

Les petits blogs qui ne sont pas régulièrement mis à jour sont souvent vidés des résultats de recherche. Plus tout ce qu'ils pensent être un splog .

David
la source
5

Eh bien, la plupart du contenu Twitter n'est pas indexé par Google, même s'il est public. Il était auparavant disponible pour Google, mais ce n'est plus le cas depuis l'expiration de leur accord.

Source .

Alex
la source
Bien que cela soit vrai, la question demande quel "contenu de haute qualité" n'est pas disponible dans Google. La plupart de Twitter ne répondraient pas à ces critères :) Je vois cependant un tweet étrange apparaître dans la recherche Google.
HappyTimeGopher
4

Cela dépend de quel pays vous êtes. En Allemagne, il ne montre pas des milliers de sites qui, selon le gouvernement, ne sont pas bons pour vous, et la liste augmente par milliers chaque année.

Google est le moteur de la censure d'Internet. Si vous voulez un Internet gratuit, utilisez des sociétés non malveillantes, comme DuckDuckGo ou d'autres.

Hellagot
la source
1

Les sites avec tellement de contenu que Google n'a tout simplement pas eu le temps (ni l'envie) de tout indexer.

Les sites qui ne disposent pas d'un plan de site explorable et qui nécessitent que Google fournisse des termes de recherche pour accéder aux résultats disponibles sur le site peuvent ne pas être entièrement indexés.

Joséphine Bonaparte
la source