Sto cercando di scaricare un URL simile http://www.somesite.com/restaurants.html#photo=22x00085
.
L'ho inserito tra virgolette singole, ma scarica solo http://www.somesite.com/restaurants.html che non è la pagina corretta.
C'è una soluzione?
Sto cercando di scaricare un URL simile http://www.somesite.com/restaurants.html#photo=22x00085
.
L'ho inserito tra virgolette singole, ma scarica solo http://www.somesite.com/restaurants.html che non è la pagina corretta.
C'è una soluzione?
Risposte:
wget
sta funzionando bene. La sintassi dell'URI specifica che il frammento - la #foo
parte - deve essere interpretato interamente sul lato client e non utilizzato durante il recupero del documento stesso.
Ad esempio, se si tratta di una pagina HTML, il browser potrebbe scorrere fino a una sezione con nome o, nel tuo caso, attivare un codice JavaScript che mostra una particolare foto.
In altre parole, per quanto wget
riguarda gli URI
http://www.somesite.com/restaurants.html#photo=22x00085
ehttp://www.somesite.com/restaurants.html
... punta alla stessa pagina /restaurants.html
. Spetta al tuo browser fare il resto. L'apertura restaurants.html#photo=22x00085
nel browser dovrebbe funzionare correttamente.
Senza visitare il link corretto, non posso dire quale sia, ma ci sono solo due opzioni:
L'hash fa effettivamente parte del nome del documento richiesto. In questo caso, puoi codificarlo:
Nell'altro caso, in circostanze normali, http://www.somesite.com/restaurants.html e http://www.somesite.com/restaurants.html#photo=22x00085 dovrebbero puntare alla stessa pagina. La parte dopo l'hash indica semplicemente l' ancoraggio a cui il browser dovrebbe scorrere dopo aver caricato la pagina; non viene nemmeno inviato al server.
Tuttavia, è possibile che l'hash sia (ab) utilizzato per caricare una particolare foto con JavaScript. Wget non è in grado di interpretare JavaScript, quindi non puoi farci nulla.
Questo non è l'URL per l'immagine. È l'URL di una pagina che utilizza uno script o un altro codice per recuperare l'immagine. Prova a caricare la pagina con JavaScript disattivato. Questo è ciò che wget ti sta prendendo.
Per trovare l'URL per l'immagine, prova a visitare la pagina tramite il browser e fai clic con il pulsante destro del mouse sulla foto. Dovrebbe esserci un'opzione per visualizzare informazioni sull'immagine, incluso il suo URL.
Se il problema persiste, è possibile che l'immagine sia stata caricata tramite Flash o altri programmi lato client. Puoi usare Fiddler o Wireshark per vedere quale URL sta caricando.
Se ci fornisci l'URL effettivo del sito con l'immagine, possiamo aiutarti a determinare come viene caricata l'immagine.