Downloader di siti Web (cache?) Per visualizzare siti offline


9

Esiste un modo portatile per scaricare o memorizzare nella cache tutte le pagine di un sito Web per visualizzarle offline? Domani ho un volo per lo sci di fondo e vorrei essere in grado di memorizzare nella cache alcune pagine Web (in particolare la pagina del documento python ( http://docs.python.org/ ) e il riferimento pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).

Idealmente mi piacerebbe un componente aggiuntivo di Firefox o qualcosa del genere, ma tutto funzionerà bene fino a quando posso eseguirlo su Linux.


Risposte:


15

Uso HTTrack .

Ti permette di scaricare un sito Web da Internet in una directory locale, costruendo ricorsivamente tutte le directory, ottenendo HTML, immagini e altri file dal server sul tuo computer


Ho usato questo in passato, bella soluzione gratuita.
MaQleod,

1
HTTrack è il migliore per Linux e Windows e c'è un enorme elenco di opzioni per configurare il processo di download .. Lo adoro
eslambasha

L'ho usato anch'io; ora offrono anche una versione Android.
gparyani,

-1 Non crea "tutte le directory", non ottiene tutte le "immagini e altri file". Ottiene solo ciò a cui è collegato.
barlop

6

Uso wget con queste opzioni per eseguire il mirroring di un sito per l'utilizzo offline

wget -cmkE -np http://example.com/a/section/i/like

dove

-m attiva le opzioni di mirroring per il mirroring di un sito localmente

-c continua un download precedente nel caso in cui abbia già scaricato alcune pagine

-k converte href assoluto in modo che punti a quelli locali per la visualizzazione offline

-E assicura che i file abbiano estensione .html dopo il download.

-np scarica solo gli oggetti in / a / section / i / e non memorizza nella cache l'intero sito.

Ad esempio, volevo scaricare la documentazione del sud ma non i biglietti del sud, ecc ...

wget -cmkE -np http://south.aeracode.org/docs/index.html

Uso Windows ed eseguo wget su cygwin ma esiste anche una porta wget nativa per Windows .

Sebbene, nel tuo caso, puoi scaricare i documenti offline di Python dalla sezione dei documenti di Python


1

Prova http://www.downthemall.net/ un plugin per Firefox. L'ho usato per scaricare 250 pagine di PDF in oltre 20 file separati. È estremamente potente. Ha una sintassi jolly / query che consente di ottenere chirurgicamente solo i file desiderati e nessuno di quelli irrilevanti che non si '.


1

Alcune estensioni di Firefox che conosco:

  • ScrapBook

    ti aiuta a salvare le pagine Web e gestire facilmente le raccolte. Le caratteristiche principali sono leggerezza, velocità, accuratezza e supporto multilingue. Le caratteristiche principali sono:

    • Salva pagina Web
    • Salva frammento di pagina Web
    • Salva sito Web
    • Organizza la raccolta allo stesso modo dei segnalibri
    • Ricerca di testo completo e ricerca rapida di filtri della raccolta
    • Modifica della pagina Web raccolta
    • Funzionalità di modifica di testo / HTML simile alle note di Opera
  • ScrapBook Plus

    Differenza tra ScrapBook Plus e ScrapBook:

    • ordinamento più veloce
    • importazione ed esportazione più veloci
    • apri la finestra per gestire la tua raccolta direttamente dalla barra laterale
    • gestione semplificata della "procedura guidata Combina"
    • nuove funzionalità per "Acquisisci più URL" (filtro per escludere collegamenti, utilizzare il titolo del sito Web o titolo del collegamento come nuovo titolo per la voce nella barra laterale, specificare il tempo di attesa tra il download da 0 a 3 secondi, utilizzare UTF-8 o ISO-8859-1 come set di caratteri)
    • nuova finestra "Cattura" (il download deve essere avviato manualmente, lo scorrimento automatico è disattivato)
    • 6 evidenziatori nell'editor
  • UnMHT

    consente di visualizzare i file in formato di archivio Web MHT (MHTML) e di salvare pagine Web complete, inclusi testo e grafica, in un singolo file MHT

  • Pocket (non un'estensione; una funzionalità di Firefox integrata)

    consente di salvare pagine Web e video su Pocket con un solo clic. Pocket rimuove il disordine e salva la pagina in una vista pulita e priva di distrazioni e ti consente di accedervi mentre sei in movimento attraverso l'app Pocket.

    Nota che:

    Il salvataggio e l'accesso all'elenco tascabile su Firefox richiede una connessione a Internet. La visualizzazione offline è possibile su altri dispositivi con l'app Pocket.


0

Puoi scaricare un intero sito Web o parte di un sito Web con wget.

wget -r http://docs.python.org/

Controlla il manuale di wget per altre opzioni che potresti voler passare, ad esempio per limitare l'utilizzo della larghezza di banda, controllare la profondità di ricorsione, impostare elenchi di esclusione, ecc.

Un altro approccio alla navigazione offline è l'uso di un proxy di memorizzazione nella cache. Wwwoffle è uno che ha molte funzionalità per facilitare la conservazione per la navigazione offline, come l'override delle date di scadenza specificate dal server e una capacità di pre-recupero ricorsiva. (Uso wwwoffle dai miei giorni di accesso remoto.)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.