Ma mère suit un cours en ligne afin d'être une sorte de bibliothécaire, dans ce cours, ils couvrent les recherches booléennes, afin qu'ils puissent rechercher des bases de données efficacement, cependant, elle a reçu une question ressemblant à ceci:
La recherche «x OU y» donnera 105 000 résultats, tandis que la recherche de x seulement donnera 80 000 résultats, et une recherche pour seulement y obtiendra 35 000 résultats. Pourquoi la recherche "x OU y" donne-t-elle 105 000 visites, alors que les recherches individuelles combinées donnent 115 000 visites?
Pour moi, cela semblait étrange, alors je l'ai testé moi-même, en utilisant les mots bacon et sandwich .
- Seul le bacon a donné 179 000 000 résultats
- Seul le sandwich a donné 312 000 000 résultats
- bacon OU sandwich a donné 491 000 000 résultats
Mais pour moi ça s'additionne: 179 000 000 (bacon) + 312 000 000 (sandwich) = 491 000 000 (bacon OU sandwich)
Pourquoi une requête OR pourrait-elle entraîner moins de hits que les deux requêtes individuelles combinées?
Réponses:
Astuce: La recherche x ET y donnera 10 000 résultats.
la source
Le principe de comptage qui s'applique ici est l' inclusion-exclusion .
Un diagramme de Venn peut être plus convaincant pour quelqu'un qui peut être intimidé par la notation.
la source
Document 1: Le chat est sur la table
Document 2: Mon chat est noir
Document 3: Le chien est sous la table
Document 4: Quel est le nom de votre chat?
Document 5: Ceci est une photo en noir et blanc
Recherche de chat : les documents retournés sont 1,2,4 (3 documents retournés)
Recherche de noir : les documents retournés sont ...
Recherche de chat OU noir : les documents retournés sont ...
:-D :-D
la source
En termes simples:
Rechercher X vous donne n réponses.
La recherche de Y vous donne m réponses.
Rechercher X ET Y vous donne p réponses.
En recherchant X OR Y, la recherche s'interrompt dès qu'elle trouve X ou Y. Donc s'il y a un X avant un Y, ce Y ne sera pas compté dans la recherche de X OU Y. Par conséquent, votre recherche de X OU Y vous donnera n + m - p réponses.
Il est important de noter que les résultats seront les mêmes, que vous fassiez 2 recherches ou une seule. C'est juste qu'en sommant les deux recherches, certains documents sont comptés deux fois.
la source
Imaginez que vous n'ayez qu'un seul document. Voici le document n ° 1 avec ceci:
Imaginez maintenant que vous ayez une fonction de recherche qui peut vous donner tous les documents basés sur un mot-clé:
Notez que le nombre de documents dans les deux cas est 1. Maintenant, si vous avez une fonction de recherche qui vous donne le nombre de documents correspondant à un ou plusieurs des mots-clés fournis:
Lorsque vous ajoutez le nombre de documents contenant
X
au nombre de documents contenantY
, cela vous oblige à compter le même document deux fois. Dans votre cas, cela s'est produit des10000
fois comme indiqué ci-dessus :)la source