Rechercher et remplacer des valeurs de chaîne dans la liste

153

J'ai cette liste:

words = ['how', 'much', 'is[br]', 'the', 'fish[br]', 'no', 'really']

Ce que je voudrais, c'est remplacer [br]par une valeur fantastique similaire à <br />et ainsi obtenir une nouvelle liste:

words = ['how', 'much', 'is<br />', 'the', 'fish<br />', 'no', 'really']
Eric Herlitz
la source

Réponses:

274
words = [w.replace('[br]', '<br />') for w in words]

Ceux-ci sont appelés des compréhensions de liste .

sberry
la source
5
En effectuant une comparaison entre cette méthode de compréhension de liste et la méthode de carte (publiée par @Anthony Kong), cette méthode de liste était environ deux fois plus rapide. En outre, il a permis d'insérer plusieurs remplacements dans le même appel, par exempleresname = [name.replace('DA', 'ADE').replace('DC', 'CYT').replace('DG', 'GUA').replace('DT', 'THY') for name in ncp.resname()]
Steven C. Howell
1
@sberry J'ai une liste ['word STRING', 'word_count BIGINT', 'corpus STRING', 'corpus_date BIGINT']où j'essaye de remplacer 'par vide mais cela ne fonctionne pas. comment pouvons-nous remplacer cela en utilisant cela?
Sandeep Singh
Que faire si l'un des éléments est un flottant / entier?
Patriots299
32

Vous pouvez utiliser, par exemple:

words = [word.replace('[br]','<br />') for word in words]
houbysoft
la source
2
@macetw En fait la première réponse.
CodeIt
en regardant l'horodatage, il semble qu'ils aient tous les deux répondu en même temps, peut-être que celui-ci est en retard d'une fraction de seconde ...
maksbd19
31

En plus de la compréhension de la liste, vous pouvez essayer la carte

>>> map(lambda x: str.replace(x, "[br]", "<br/>"), words)
['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really']
Anthony Kong
la source
15

Au cas où vous vous poseriez des questions sur les performances des différentes approches, voici quelques timings:

In [1]: words = [str(i) for i in range(10000)]

In [2]: %timeit replaced = [w.replace('1', '<1>') for w in words]
100 loops, best of 3: 2.98 ms per loop

In [3]: %timeit replaced = map(lambda x: str.replace(x, '1', '<1>'), words)
100 loops, best of 3: 5.09 ms per loop

In [4]: %timeit replaced = map(lambda x: x.replace('1', '<1>'), words)
100 loops, best of 3: 4.39 ms per loop

In [5]: import re

In [6]: r = re.compile('1')

In [7]: %timeit replaced = [r.sub('<1>', w) for w in words]
100 loops, best of 3: 6.15 ms per loop

comme vous pouvez le voir pour ces modèles simples, la compréhension de liste acceptée est la plus rapide, mais regardez ce qui suit:

In [8]: %timeit replaced = [w.replace('1', '<1>').replace('324', '<324>').replace('567', '<567>') for w in words]
100 loops, best of 3: 8.25 ms per loop

In [9]: r = re.compile('(1|324|567)')

In [10]: %timeit replaced = [r.sub('<\1>', w) for w in words]
100 loops, best of 3: 7.87 ms per loop

Cela montre que pour des substitutions plus compliquées, un reg-exp pré-compilé (comme dans 9-10) peut être (beaucoup) plus rapide. Cela dépend vraiment de votre problème et de la partie la plus courte de la reg-exp.

Jörn Hees
la source
3

Un exemple avec la boucle for (je préfère List Comprehensions).

a, b = '[br]', '<br />'
for i, v in enumerate(words):
    if a in v:
        words[i] = v.replace(a, b)
print(words)
# ['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really']
Waket Zheng
la source