Trova e sostituisci i valori di stringa nell'elenco


153

Ho questo elenco:

words = ['how', 'much', 'is[br]', 'the', 'fish[br]', 'no', 'really']

Quello che vorrei è sostituire [br]con un valore fantastico simile <br />e quindi ottenere un nuovo elenco:

words = ['how', 'much', 'is<br />', 'the', 'fish<br />', 'no', 'really']

Risposte:


274
words = [w.replace('[br]', '<br />') for w in words]

Questi sono chiamati Comprensioni elenco .


5
Eseguendo un confronto tra questo metodo di comprensione dell'elenco e il metodo della mappa (pubblicato da @Anthony Kong), questo metodo dell'elenco era circa 2 volte più veloce. Inoltre, ha permesso di inserire più sostituzioni nella stessa chiamata, ad esempioresname = [name.replace('DA', 'ADE').replace('DC', 'CYT').replace('DG', 'GUA').replace('DT', 'THY') for name in ncp.resname()]
Steven C. Howell,

1
@sberry Ho un elenco in ['word STRING', 'word_count BIGINT', 'corpus STRING', 'corpus_date BIGINT']cui sto cercando di sostituire 'con vuoto ma questo non funziona. come possiamo sostituirlo usando questo?
Sandeep Singh,

Cosa succede se uno degli elementi è float / intero?
Patriots299

32

Puoi usare, ad esempio:

words = [word.replace('[br]','<br />') for word in words]

2
@macetw In effetti la prima risposta.
CodeIt

guardando il timestamp sembra che entrambi abbiano risposto allo stesso tempo, forse questo è in ritardo di qualche frazione di secondo ...
maksbd19

31

Oltre alla comprensione dell'elenco, puoi provare la mappa

>>> map(lambda x: str.replace(x, "[br]", "<br/>"), words)
['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really']

15

Nel caso ti stia chiedendo delle prestazioni dei diversi approcci, ecco alcuni tempi:

In [1]: words = [str(i) for i in range(10000)]

In [2]: %timeit replaced = [w.replace('1', '<1>') for w in words]
100 loops, best of 3: 2.98 ms per loop

In [3]: %timeit replaced = map(lambda x: str.replace(x, '1', '<1>'), words)
100 loops, best of 3: 5.09 ms per loop

In [4]: %timeit replaced = map(lambda x: x.replace('1', '<1>'), words)
100 loops, best of 3: 4.39 ms per loop

In [5]: import re

In [6]: r = re.compile('1')

In [7]: %timeit replaced = [r.sub('<1>', w) for w in words]
100 loops, best of 3: 6.15 ms per loop

come puoi vedere per schemi così semplici la comprensione dell'elenco accettata è la più veloce, ma guarda quanto segue:

In [8]: %timeit replaced = [w.replace('1', '<1>').replace('324', '<324>').replace('567', '<567>') for w in words]
100 loops, best of 3: 8.25 ms per loop

In [9]: r = re.compile('(1|324|567)')

In [10]: %timeit replaced = [r.sub('<\1>', w) for w in words]
100 loops, best of 3: 7.87 ms per loop

Questo dimostra che per sostituzioni più complicate un reg-exp precompilato (come in 9-10) può essere (molto) più veloce. Dipende molto dal tuo problema e dalla parte più breve di reg-exp.


3

Un esempio con for loop (preferisco l'elenco Comprensioni).

a, b = '[br]', '<br />'
for i, v in enumerate(words):
    if a in v:
        words[i] = v.replace(a, b)
print(words)
# ['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really']
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.