Est-il possible de rechercher des sites MediaWiki à l'aide d'expressions régulières?

9

Je voudrais rechercher des expressions utilisant des expressions régulières sur des sites tels que Wikipédia et Wikimedia Commons. Est-il possible de faire cela?

Exemple de requête de recherche d'expressions rationnelles: (facebook | google) (historique de l'entreprise | sites Web)

Il est déjà possible de faire la même chose sur Google ( comme démontré ici ), donc je veux savoir si c'est également possible pour Wikipedia.

Anderson Green
la source
Seriez-vous prêt à télécharger plusieurs gigaoctets de données et à effectuer tout le filtrage sur votre propre ordinateur?
svick
Il semble possible de le faire en utilisant AutoWikiBrowser: en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/…
Anderson Green
Vous pouvez utiliser AWB pour rechercher une certaine page (ou un ensemble de pages), mais pas tout le wiki, ce que je supposais être ce que vous vouliez.
svick
Oui, je voulais rechercher le wiki entier. Y a-t-il des outils sur le serveur d'outils pour cela?
Anderson Green

Réponses:

3

Il est possible de rechercher sur Wikipedia (ou sur tout autre site auquel un moteur de recherche peut accéder) à l'aide d'expressions régulières simples, tant que vous vous appuyez sur un moteur de recherche. La requête de recherche Google suivante recherche dans Wikipedia les correspondances de l'expression régulière (Yahoo|Google|Microsoft):

https://www.google.com/#hl=en&sclient=psy-ab&q=site:en.wikipedia.org+(google+OR+yahoo+OR+microsoft)&oq=site:en.wikipedia.org+(google+OR + yahoo + OR + microsoft) & gs_l = hp.3 ... 87411.96861.2.97076.26.24.2.0.0.0.79.1141.24.24.0 ... 0.0 ... 1c.1.7.psy-ab.s2oGD_2LKy4 & pbx = 1 & bav = on .2, ou .r_cp.r_qf. & Bvm = bv.44158598, d.dmg & fp = dc8abc04c054405e & biw = 1366 & bih = 639

Anderson Green
la source
2

Si vous êtes uniquement intéressé à faire une recherche regex de titres Wikipedia , Crossword Nexus vous permet de le faire. http://crosswordnexus.com/wiki

Alex B.
la source
2

Il est disponible et propulsé par le CirrusSearch (basé sur ElasticSearch ) qui est le moteur de recherche utilisé dans les sites MediaWiki et la plateforme Wikimedia.

Quelques exemples d'utilisation:

Remarque: référence complète du guide et source - sur Wikipédia: Aide: Recherche # Search_string_syntax .

Quant à votre question:

Opérateurs logiques

Le moteur de recherche prend en charge la logique booléenne dans les recherches. Les opérateurs logiques incluent le caractère "-" (signe moins) pour "non logique", les ET, les OU et les parenthèses de regroupement: (_).

OU logique doit être orthographié en majuscules; l'opérateur AND est supposé pour tous les termes (séparés par des espaces), mais AND capital est équivalent.

Plus d'exemples:

  • Simple AND, OR: "credit card" OR "payment card", "credit card" AND "payment card"- fonctionnera comme prévu.
  • Suffixé tilde caractère pour la recherche floue ( « sons comme ») - Par exemple, la recherche de charlie~ parker~rendements Charlie Parker, Charles Palmer, Charley Parks(jusqu'à deux différence de caractère, non compris le premier).
  • Recherche générique - recherche face*e- commence par faceet se termine par un eavec quoi que ce soit au milieu. entrez la description de l'image ici

Lecture supplémentaire

En savoir plus sur le moteur de recherche et cette extension pour dévoiler toutes leurs fonctionnalités et fonctionnalités.

arieljannai
la source