Rimozione di numeri dalla stringa [chiuso]


121

Come posso rimuovere le cifre da una stringa?


19
Con re:result = re.sub(r'[0-9]+', '', s)
Wiktor Stribiżew

con regex dovrai aggiungere \. inoltre, poiché può essere un numero decimale, penso. come risultato = re.sub (r '[0-9 \.] +', '', s)
GurhanCagin

1
"\d"è lo stesso in una regex di "[0-9]", quindi puoi farlo result = re.sub(r"\d+", "", s)invece. La velocità dipenderà probabilmente dalla particolare stringa utilizzata, ma per me, ha re.subimpiegato circa il doppio del tempo str.translate(leggermente più lungo se non si utilizza un pattern precompilato).
Nathan il

Risposte:


185

Funzionerebbe per la tua situazione?

>>> s = '12abcd405'
>>> result = ''.join([i for i in s if not i.isdigit()])
>>> result
'abcd'

Questo fa uso di una comprensione dell'elenco e ciò che sta accadendo qui è simile a questa struttura:

no_digits = []
# Iterate through the string, adding non-numbers to the no_digits list
for i in s:
    if not i.isdigit():
        no_digits.append(i)

# Now join all elements of the list with '', 
# which puts all of the characters together.
result = ''.join(no_digits)

Come sottolineano @AshwiniChaudhary e @KirkStrauser, in realtà non è necessario utilizzare le parentesi nell'unica riga, rendendo il pezzo all'interno delle parentesi un'espressione generatrice (più efficiente di una comprensione dell'elenco). Anche se questo non soddisfa i requisiti per il tuo incarico, è qualcosa di cui dovresti leggere alla fine :):

>>> s = '12abcd405'
>>> result = ''.join(i for i in s if not i.isdigit())
>>> result
'abcd'

@SeanJohnson Awesome! Sono sicuro di averlo imparato da qualcun altro su questo sito, quindi il ciclo è completo :)
RocketDonkey

@RocketDonkey non c'è bisogno di[]
Ashwini Chaudhary

3
In Python 2.7 e versioni successive, non sono necessarie le parentesi per la comprensione dell'elenco. Puoi lasciarli fuori e diventa un'espressione generatrice.
Kirk Strauser

Risolto - grazie @ AshwiniChaudhary / @ KirkStrauser.
RocketDonkey

@RocketDonkey aggiunge anche qualche spiegazione, il solo vedere il codice non aiuterà l'OP immagino.
Ashwini Chaudhary

98

E, solo per gettarlo nel mix, è spesso dimenticato str.translateche funzionerà molto più velocemente del ciclo / espressioni regolari:

Per Python 2:

from string import digits

s = 'abc123def456ghi789zero0'
res = s.translate(None, digits)
# 'abcdefghizero'

Per Python 3:

from string import digits

s = 'abc123def456ghi789zero0'
remove_digits = str.maketrans('', '', digits)
res = s.translate(remove_digits)
# 'abcdefghizero'

13
Questo approccio non funzionerà in Python3. Fai invece: 'abc123def456ghi789zero0'.translate({ord(k): None for k in digits})
valignatev

3
La migliore soluzione per Python2.
Harsh Wardhan

Non funziona per le stringhe di caratteri Unicode
Harry M

20

Non sono sicuro che il tuo insegnante ti consenta di usare i filtri ma ...

filter(lambda x: x.isalpha(), "a1a2a3s3d4f5fg6h")

ritorna-

'aaasdffgh'

Molto più efficiente del looping ...

Esempio:

for i in range(10):
  a.replace(str(i),'')

1
restituisce invece questo: <oggetto filtro a 0x03475FD0>
lone_coder

5

Che dire di questo:

out_string = filter(lambda c: not c.isdigit(), in_string)

4
L'uscita è <filter object at 0x7f749e1745c0>. Python3.6
TitanFighter

@TitanFighter Puoi forzare il generatore in un oggetto elenco avvolgendo l'oggetto restituito dal filtro nell'elenco (filtro (...))
ahlusar1989

5

Solo alcuni (altri hanno suggerito alcuni di questi)

Metodo 1:

''.join(i for i in myStr if not i.isdigit())

Metodo 2:

def removeDigits(s):
    answer = []
    for char in s:
        if not char.isdigit():
            answer.append(char)
    return ''.join(char)

Metodo 3:

''.join(filter(lambda x: not x.isdigit(), mystr))

Metodo 4:

nums = set(map(int, range(10)))
''.join(i for i in mystr if i not in nums)

Metodo 5:

''.join(i for i in mystr if ord(i) not in range(48, 58))

2
Sarebbe utile mostrare un confronto di efficienza su questi.
nu everest

2

Dì st è la tua stringa non formattata, quindi esegui

st_nodigits=''.join(i for i in st if i.isalpha())

come menzionato sopra. Ma immagino che tu abbia bisogno di qualcosa di molto semplice quindi dì che s è la tua stringa e st_res è una stringa senza cifre, quindi ecco il tuo codice

l = ['0','1','2','3','4','5','6','7','8','9']
st_res=""
for ch in s:
 if ch not in l:
  st_res+=ch

1

Mi piacerebbe usare regex per farlo, ma dal momento che puoi usare solo elenchi, cicli, funzioni, ecc.

ecco cosa mi è venuto in mente:

stringWithNumbers="I have 10 bananas for my 5 monkeys!"
stringWithoutNumbers=''.join(c if c not in map(str,range(0,10)) else "" for c in stringWithNumbers)
print(stringWithoutNumbers) #I have  bananas for my  monkeys!

1

Se capisco bene la tua domanda, un modo per farlo è suddividere la stringa in caratteri e quindi controllare ogni carattere in quella stringa usando un ciclo se si tratta di una stringa o di un numero e poi se stringa salvarlo in una variabile e poi una volta il ciclo è finito, mostralo all'utente


Un ciclo for esegue automaticamente l'iterazione attraverso ogni carattere di una stringa, quindi non è necessario suddividere la stringa in caratteri.
Ashwini Chaudhary
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.