Ho una stringa che sembra così:
6Â 918Â 417Â 712
Il modo chiaro per tagliare questa stringa (come ho capito Python) è semplicemente dire che la stringa si trova in una variabile chiamata s
, otteniamo:
s.replace('Â ', '')
Questo dovrebbe fare il trucco. Ma ovviamente si lamenta del fatto che il carattere non ASCII '\xc2'
nel file blabla.py non è codificato.
Non sono mai riuscito a capire come passare da una codifica all'altra.
Ecco il codice, è proprio come sopra, ma ora è nel contesto. Il file viene salvato come UTF-8 nel blocco note e ha la seguente intestazione:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
Il codice:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
Non va oltre s.replace
...
u