Rechercher quand une phrase a été ajoutée à une page Wikipedia

9

Existe-t-il un moyen de savoir quand un mot ou une expression spécifique a été ajouté à une page Wikipedia? Je veux trouver un moyen d'obtenir la première page qui contient une correspondance d'une phrase spécifique (par exemple, la première occurrence de <ref>webapps.stackexchange.com</ref>dans l'historique de révision d'une page). (La recherche manuelle dans l'historique des révisions d'une page serait extrêmement fastidieuse, j'ai donc besoin d'une sorte de solution automatisée.)

Anderson Green
la source
Cette question est pertinente (mais elle semble discuter d'un sujet légèrement différent, et elle nécessite une certaine connaissance des systèmes de contrôle des révisions): webapps.stackexchange.com/questions/15938/…
Anderson Green
Afin d'aider les gens à trouver cela via google: Quand un mot a-t-il été ajouté à une page Wikipedia?
fNek
@fNek Voir la réponse ci-dessous: vous pouvez utiliser WikiBlame pour trouver quand un mot ou une phrase a été ajouté à une page.
Anderson Green

Réponses:

7

Il existe un outil appelé WikiBlame qui vous permet de faire exactement cela: vous entrez un nom de page et une phrase à rechercher et vous dirigera vers la modification qui l'a ajouté.

Il est également lié à partir de la page Historique de chaque page de Wikipédia en anglais (en tant que «Recherche d'historique de révision»).

svick
la source
Dans la page des résultats de la recherche, la première occurrence de l'expression de recherche se trouve à côté de "Insertion trouvée entre". Vous pouvez rechercher dans tout l'historique des révisions en tapant un grand nombre dans le champ "révisions à vérifier" (par exemple, 10000.) Pour rechercher exclusivement pour wikitext, sélectionnez "forcer la recherche pour wikitext".
Anderson Green,
Voici un exemple spécifique de recherche (pour l'expression "gameplay de base" dans l'article "Minecraft"): wikipedia.ramselehof.de/…
Anderson Green
1

Wikimedia fournit un vidage XML de l'historique complet des révisions pour tous les articles Wikipédia. Cet ensemble de données contient une version de ces données d'avril 2010. Cet ensemble de données ne contient pas le texte intégral des révisions, mais uniquement les métadonnées sur les révisions, y compris des éléments comme la langue, l'horodatage, l'article, etc.

Sur chaque page, dans le coin supérieur droit se trouve un Historybouton qui vous amène à l'historique des révisions de cette page.

entrez la description de l'image ici

Source: Historique des révisions de Wikipedia

abhshkdz
la source
Comment obtenir un vidage XML de l'historique des révisions pour une page spécifique?
Anderson Green
Voir l'édition. C'est bien ce que vous cherchiez?
abhshkdz
Je préférerais une sorte de solution automatisée, au lieu de parcourir chaque révision à la main pour trouver une chaîne spécifique. Est-il possible de trouver la première occurrence d'une phrase dans l'historique des révisions (sans rechercher manuellement, ce qui pourrait prendre des heures)?
Anderson Green
1
L'utilisation du vidage XML est une exagération: vous n'avez vraiment pas besoin de télécharger l'historique complet des révisions de tous les articles sur Wikipédia simplement pour rechercher l'historique d'un article.
svick
Évidemment. Je donnais juste toutes les informations disponibles.
abhshkdz