AttributeError: l'oggetto 'module' non ha attributi 'urlopen'


146

Sto provando a utilizzare Python per scaricare il codice sorgente HTML di un sito Web ma sto ricevendo questo errore.

Traceback (most recent call last):  
    File "C:\Users\Sergio.Tapia\Documents\NetBeansProjects\DICParser\src\WebDownload.py", line 3, in <module>
     file = urllib.urlopen("http://www.python.org")
AttributeError: 'module' object has no attribute 'urlopen'

Sto seguendo la guida qui: http://www.boddie.org.uk/python/HTML.html

import urllib

file = urllib.urlopen("http://www.python.org")
s = file.read()
f.close()

#I'm guessing this would output the html source code?
print(s)

Sto usando Python 3.

Risposte:


245

Funziona in Python 2.x.

Per Python 3 guarda nei documenti :

import urllib.request

with urllib.request.urlopen("http://www.python.org") as url:
    s = url.read()
    # I'm guessing this would output the html source code ?
    print(s)

3
Ciao Eumiro, usando l'istruzione 'with' in Python, immagino che chiuda automaticamente la connessione una volta terminato di usarla? Simile a un'istruzione use in C #?

@Sergio: esattamente! E attraverso il rientro vedi dove è ancora aperto il tuo file.
eumiro,

Ciao @eumiro, ho un errore di "IndentationError: previsto un blocco rientrato" quando scrivo, posso s = url.read()chiedere come posso risolverlo per favore? x
Karen Chan,

@KarenChan ti manca un trattino prima s=url.read(); hai 4 spazi prima?
numbermaniac

19

Una soluzione compatibile con Python 2 + 3 è:

import sys

if sys.version_info[0] == 3:
    from urllib.request import urlopen
else:
    # Not Python 3 - today, it is most likely to be Python 2
    # But note that this might need an update when Python 4
    # might be around one day
    from urllib import urlopen


# Your code where you can use urlopen
with urlopen("http://www.python.org") as url:
    s = url.read()

print(s)

1
with urlopen("http://www.python.org") as url:non funziona in python2 con AttributeError: addinfourl instance has no attribute '__exit__'. url = urlopen("http://www.python.org")
Devi

15
import urllib.request as ur
s = ur.urlopen("http://www.google.com")
sl = s.read()
print(sl)

In Python v3 "urllib.request" è un modulo a sé stante, pertanto "urllib" non può essere utilizzato qui.


7

Per far funzionare ' dataX = urllib.urlopen (url) .read () ' in Python 3 (questo sarebbe stato corretto per Python 2 ) devi semplicemente cambiare 2 piccole cose.

1: la stessa istruzione urllib (aggiungi la .request nel mezzo):

dataX = urllib.request.urlopen(url).read()

2: la dichiarazione di importazione che la precede (cambia da 'import urlib' a:

import urllib.request

E dovrebbe funzionare in python3 :)


3
import urllib.request as ur

filehandler = ur.urlopen ('http://www.google.com')
for line in filehandler:
    print(line.strip())

1

Per python 3, prova qualcosa del genere:

import urllib.request
urllib.request.urlretrieve('http://crcv.ucf.edu/THUMOS14/UCF101/UCF101/v_YoYo_g19_c02.avi', "video_name.avi")

Scarica il video nella directory di lavoro corrente

Ho ricevuto aiuto da QUI


1

Soluzione per python3:

from urllib.request import urlopen

url = 'http://www.python.org'
file = urlopen(url)
html = file.read()
print(html)

Semplice e facile da capire per i principianti. Grazie
SHR

1

Cambia DUE righe:

import urllib.request #line1

#Replace
urllib.urlopen("http://www.python.org")
#To
urllib.request.urlopen("http://www.python.org") #line2

Se hai ERRORE 403: eccezione errore proibito, prova questo:

siteurl = "http://www.python.org"

req = urllib.request.Request(siteurl, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36'})
pageHTML = urllib.request.urlopen(req).read()

Spero che il tuo problema sia stato risolto.


0

Uno dei modi possibili per farlo:

import urllib
...

try:
    # Python 2
    from urllib2 import urlopen
except ImportError:
    # Python 3
    from urllib.request import urlopen

0

Utilizzare sei moduli per rendere il codice compatibile tra python2 e python3

urllib.request.urlopen("<your-url>")```

Puoi importare sei moduli in questo modo da six.moves import urllib
Rajat Shukla,

0

il codice utilizzato in python2.x, è possibile utilizzare in questo modo:

from urllib.request import urlopen
urlopen(url)

a proposito, suggerisci che un altro modulo chiamato requestsè più facile da usare, puoi usarlo pipe usarlo in questo modo:

import requests
requests.get(url)
requests.post(url)

Ho pensato che fosse facile da usare, anche io sono un principiante .... hahah


-1
import urllib
import urllib.request
from bs4 import BeautifulSoup


with urllib.request.urlopen("http://www.newegg.com/") as url:
    s = url.read()
    print(s)
soup = BeautifulSoup(s, "html.parser")
all_tag_a = soup.find_all("a", limit=10)

for links in all_tag_a:
    #print(links.get('href'))
    print(links)
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.