Ho usato wget per scaricare file html, dove sono archiviate le immagini nel file?


15

Firefox si stava caricando molto lentamente, quindi ho deciso di utilizzare wgetper salvare i file HTML. Ho usato il seguente comando,

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

I file sono stati salvati nella mia cartella home, ma non so dove siano archiviate le immagini, ne ho bisogno per usarle Anki.

Quindi dove sono archiviate le immagini?


Questo articolo spiega le opzioni e come sono utili.
Wilf,

Risposte:


34

Preferisco usare --page-requisites( -pin breve) invece di -rqui perché scarica tutto ciò che la pagina deve visualizzare ma non altre pagine, e non devo pensare al tipo di file che voglio.

In realtà di solito sto usando qualcosa del genere

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Questo significa:

  • -E: Aggiungi .htmlal nome del file se si tratta di un file HTML ma non termina .htmlo è simile
  • -H: Scarica file anche da altri host
  • -k: Dopo aver scaricato, converti qualsiasi link in esso in modo che punti ai file scaricati
  • -p: Scarica tutto ciò di cui la pagina ha bisogno per una corretta visualizzazione offline

Sono venuto qui a cercare -Hed ero felice di conoscere -Ee -kanche. Grazie!
Charles Clayton,

2

l'utilizzo del parametro -r dovrebbe consentire a wget di scaricare l'intera cartella, comprese le immagini.

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

2

Scaricare anche i file di immagine separatamente

Penso che questo comando possa iniziare.

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Ti consente di specificare la posizione in cui salvare le immagini e quali tipi di file desideri. Forse scaricare le immagini in quanto tali è più semplice.

Fonte :

-r abilita il recupero ricorsivo. Vedere Download ricorsivo per ulteriori informazioni.

-P imposta il prefisso della directory in cui vengono salvati tutti i file e le directory.

-A imposta una lista bianca per il recupero solo di determinati tipi di file. Stringhe e pattern sono accettati ed entrambi possono essere usati in un elenco separato da virgole (come visto sopra). Vedere Tipi di file per ulteriori informazioni.

Copia dei file di immagine dalla tua cartella

Ho notato che il sito Web utilizza file di immagini PNG. Puoi semplicemente copiarli dalla tua cartella. Questo dovrebbe essere eseguito nella cartella in cui è stata memorizzata la pagina Web.

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;

1

Wget scarica semplicemente il file HTML della pagina, non le immagini nella pagina, poiché le immagini nel file HTML della pagina sono scritte come URL. Per fare quello che vuoi, usa -R(ricorsivo), l' -Aopzione con i suffissi del file immagine, l' --no-parentopzione, per non farlo ascendere, e l' --levelopzione con 1.

In particolare wget -R -A .jpg,.png,.gif --no-parent --level <url>

Ancora meglio, la maggior parte dei browser ha metodi per salvare le pagine per la visualizzazione offline .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.