Est-ce que quelqu'un sait comment Google ou Yahoo effectuent des recherches de mots-clés contre de très grandes quantités de données? Quel type de base de données ou de technologies utilisent-ils pour cela?
Cela prend quelques millisecondes, mais ils ont plus d'un milliard de pages indexées.
database-design
full-text-search
rkosegi
la source
la source
Réponses:
Je suis sûr qu'il y a une combinaison de choses:
beaucoup - les données sont distribuées et répliquées sur de nombreux nœuds et différents centres de données
la source
Pigeons .
Le cœur de la technologie de recherche de Google est PigeonRank ™ , un système de classement des pages Web développé par les fondateurs de Google, Larry Page et Sergey Brin de l'Université de Stanford:
la source
Il est important de garder à l'esprit quelques points à propos de Google:
Leur DB est le propriétaire BigTable - il a été conçu sur GOOGLE pour répondre exactement à leurs besoins
Leur base de données propriétaire est construite sur le système de fichiers propriétaire, le système de fichiers Google, qui a été conçu, une fois encore , par GOOGLE , de manière à pouvoir être facilement étendu à l’aide de matériel standard. Comme Aaron l'a mentionné dans sa réponse, ils ont un grand nombre de serveurs moyens au lieu d'un petit nombre de serveurs très puissants.
Ils stockent des tables individuelles sur plusieurs machines afin de rendre l'accès plus rapide: leur logiciel sait quelles données se trouvent sur quelle machine. Au lieu de parcourir un disque pour le localiser, il peut accéder directement au serveur avec les informations appropriées.
la source
Google n'utilise pas la technologie de base de données relationnelle traditionnelle. Il a développé sa propre technologie, grande table et carte réduite. Les documents de recherche originaux se trouvent ici: Big Table et Map / Reduce . La table SSTable, triée, est également intéressante .
Une technologie similaire est maintenant utilisée dans les bases de données hadoop et NoSQL .
la source
Lisez Steven Levy " Dans le plex: comment Google pense, travaille et façonne nos vies ". Ce livre est une lecture fascinante sur tout ce qui concerne Google. Il traite en détail de la technologie et de l’ingénierie qui sous-tendent la recherche. Aaron résume très bien sa réponse et le livre de Levy vous donnera plus de détails sur la façon dont ils le font.
la source