Google prétend être juste, et il est dans l'intérêt de la société (la plupart du temps) de parcourir Internet pour tout et tout ce à quoi ses araignées peuvent accéder. Je veux savoir:
- Quel type de contenu (accessible au public) Google ne parvient-il pas à fournir?
- Existe-t-il un type de contenu spécifique que Google ne peut pas récupérer?
Les références, en particulier à la propre documentation de Google, seraient particulièrement impressionnantes.
google-search
samthebrand
la source
la source
Réponses:
Quelques idées sur le type de choses:
robots.txt
fichier d' un domaine est exclu de l'index Google.En savoir plus sur le Deep Web
la source
Mis à part Twitter, Google n'indexe pas très bien Tumblr . Les articles de blog sur Tumblr sont plus faciles à trouver en utilisant la recherche Tumblr. De plus, tout sur Google Sites n'est pas (ou est à peine) indexé. Si vous démarrez un site Google, obtenez votre propre domaine.
Les petits blogs qui ne sont pas régulièrement mis à jour sont souvent vidés des résultats de recherche. Plus tout ce qu'ils pensent être un splog .
la source
Eh bien, la plupart du contenu Twitter n'est pas indexé par Google, même s'il est public. Il était auparavant disponible pour Google, mais ce n'est plus le cas depuis l'expiration de leur accord.
Source .
la source
Cela dépend de quel pays vous êtes. En Allemagne, il ne montre pas des milliers de sites qui, selon le gouvernement, ne sont pas bons pour vous, et la liste augmente par milliers chaque année.
Google est le moteur de la censure d'Internet. Si vous voulez un Internet gratuit, utilisez des sociétés non malveillantes, comme DuckDuckGo ou d'autres.
la source
Vous ne pouvez pas rechercher un mot-clé avec des caractères spéciaux dans la recherche Google :
C'est particulièrement ennuyeux lorsque Google utilise du code.
la source
Google supprime les résultats de recherche réputés porter atteinte aux droits de propriété intellectuelle à la suite du retrait de DMCA et de demandes similaires. Voir le formulaire de demande de suppression des résultats de recherche de Google (il peut avoir une URL supplémentaire entre les deux).
la source
Les sites avec tellement de contenu que Google n'a tout simplement pas eu le temps (ni l'envie) de tout indexer.
Les sites qui ne disposent pas d'un plan de site explorable et qui nécessitent que Google fournisse des termes de recherche pour accéder aux résultats disponibles sur le site peuvent ne pas être entièrement indexés.
la source