Sto usando BeautifulSoup e sto analizzando alcuni HTML.
Sto ottenendo determinati dati da ogni HTML (usando il ciclo for) e aggiungo quei dati a un certo elenco.
Il problema è che alcuni HTML hanno un formato diverso (e non hanno i dati che voglio in essi) .
Quindi, stavo cercando di utilizzare la gestione delle eccezioni e aggiungere valore nullall'elenco (dovrei farlo poiché la sequenza di dati è importante.)
Ad esempio, ho un codice come:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between <dd class='title'> and </dd>
gotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
e alcuni collegamenti non ne hanno <dd class='title'>, quindi quello che voglio fare è aggiungere una stringa nullall'elenco.
Viene visualizzato l'errore:
list index out of range.
Quello che ho fatto ho provato è aggiungere alcune righe come questa:
if not dlist[1]:
newlist.append('null')
continue
Ma non funziona. Mostra ancora l'errore:
list index out of range.
Cosa dovrei fare a riguardo? Devo usare la gestione delle eccezioni? o c'è un modo più semplice?
Eventuali suggerimenti? Qualsiasi aiuto sarebbe davvero fantastico!
Noneè chiaramente più pulito, l'OP vuole'null'in questo caso.