Comment pouvons-nous copier du texte de Wikipedia sans les parties de citation «[1]», «[2]», «[3]»?

9

Si nous copions du texte à partir d' une page Wikipedia , voici à peu près ce que nous obtenons:

L'espacement des phrases est l'espace horizontal entre les phrases dans un texte composé. C'est une question de convention typographique. [1] Depuis l'introduction de l'impression de type mobile en Europe, diverses conventions d'espacement des phrases ont été utilisées dans les langues avec un alphabet dérivé du latin. [2] Ceux-ci incluent un espace de mots normal (comme entre les mots d'une phrase), un seul espace agrandi, deux espaces pleins et, plus récemment dans les médias numériques, aucun espace. [3] Bien que les polices numériques modernes puissent ajuster automatiquement un espace de mot unique pour créer un espacement visuellement agréable et cohérent après la ponctuation du terminal, [4] la plupart des débats portent sur l'opportunité de frapper la barre d'espace du clavier une ou deux fois entre les phrases. [5]

Je ne souhaite pas copier les pièces [1]et [2]etc. C'est en fait ce que je voulais copier:

L'espacement des phrases est l'espace horizontal entre les phrases dans un texte composé. C'est une question de convention typographique. Depuis l'introduction de l'impression de type mobile en Europe, diverses conventions d'espacement des phrases ont été utilisées dans les langues avec un alphabet dérivé du latin. Ceux-ci comprennent un espace de mots normal (comme entre les mots d'une phrase), un seul espace agrandi, deux espaces pleins et, plus récemment dans les médias numériques, aucun espace. Bien que les polices numériques modernes puissent ajuster automatiquement un seul espace de mots pour créer un espacement visuellement agréable et cohérent après la ponctuation du terminal, la plupart des débats portent sur l'opportunité de frapper la barre d'espace du clavier une ou deux fois entre les phrases.

La réponse sélectionnée ci-dessous utilise l'expression régulière, mais cela ne fonctionne pas à chaque fois . (Si le texte lui-même contient [et que ]l'expression régulière ne doit pas les supprimer.)

Y a-t-il de meilleures solutions?

Pacerier
la source
Ce sont des références qui sont probablement importantes car elles renforcent souvent la crédibilité des informations présentées. L'inclusion de références est utile, en particulier pour les chercheurs.
Randolf Richardson
@Randolf L'inclusion de références peut être utile, en particulier pour les chercheurs. pas pour les êtres normaux qui veulent juste l'information
Pacerier
La fonction de recherche et de remplacement de votre traitement de texte, éventuellement appelée à partir d'une macro, pourrait être utile ici.
Keith
J'ai d'ailleurs voté contre votre question, car je pense que c'est une bonne question. En ce qui concerne les références, beaucoup de gens s'attendent à les voir, en particulier les professeurs d'université (si vous prévoyez d'y assister, vous constaterez presque certainement que la plupart des professeurs s'attendent à ce que des références soient incluses dans tous les articles de recherche que vous écrivez, et vous aurez probablement entendre d'autres élèves parler de références de temps à autre).
Randolf Richardson
@Randolf, je veux dire que je veux simplement stocker les informations pour une lecture et une utilisation personnelles futures.
Pacerier

Réponses:

9

Un bookmarklet est votre ami ...

Créez un nouveau signet de navigateur et copiez-y le code javascript ci-dessous - lorsque vous souhaitez copier du texte à partir de wikipedia, cliquez simplement dessus au préalable et il supprimera toutes les instances de [n] pour répondre à vos besoins dans la question.

javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();

Dans les coulisses, il s'agit simplement de rechercher une expression régulière et de remplacer toutes <sup>...</sup>les balises HTML de la page.

Je viens d'essayer cela dans IE7 et cela fonctionne bien, donc j'espère que cela devrait être correct dans d'autres navigateurs aussi.

Je créditerai ce fil SO de me diriger dans la bonne direction - je savais qu'un bookmarklet était la voie à suivre, mais je n'en avais jamais écrit auparavant.

Stuart McLaughlin
la source
1
+1, c'est la seule façon dont je peux penser à faire cela. Même les extensions de navigateur supplémentaires devraient utiliser une sorte d'analyse Javascript pour ce faire (et la plupart le font d'ailleurs).
Percée