Fai finta di volere che una semplice copia della pagina venga scaricata sul mio HD per la conservazione permanente. Non sto cercando un deep recursive get, solo una singola pagina, ma anche tutte le risorse caricate da quella pagina da scaricare.
Esempio: https://www.tumblr.com/
Aspettarsi:
- L'indice.html
- Qualsiasi immagine caricata
- Qualsiasi file JS caricato
- Qualsiasi file CSS caricato
- Qualsiasi immagine caricata nel file CSS
- collegamenti per le risorse della pagina localizzate per funzionare con le copie scaricate (nessuna dipendenza dal web)
Sono interessato a sapere se puoi aiutarmi a trovare la migliore sintassi di wget o altri strumenti che lo faranno. Gli strumenti che ho provato di solito non riescono a caricare le immagini dai CSS, quindi la pagina non appare mai corretta quando caricata localmente. Grazie!
Soluzione tangente
Ho trovato un modo per farlo usando FireFox. Il salvataggio predefinito è interrotto e c'è un componente aggiuntivo chiamato "Salva completato" che apparentemente può fare un buon lavoro con questo. Tuttavia, non è possibile scaricarlo perché dice che non è supportato nella versione corrente di FireFox. Il motivo è che è stato inserito in questo componente aggiuntivo: "Mozilla Archive Format". Installalo, quindi quando usi File> "Salva pagina come .." c'è una nuova opzione chiamata "Pagina Web, completa" che è essenzialmente il vecchio componente aggiuntivo, che corregge l'implementazione di magazzino che FireFox usa (il che è terribile). Questa non è una soluzione WGET ma fornisce una soluzione praticabile.
EDIT: un altro problema ridicolo per chiunque potrebbe seguire questa domanda in futuro, cercando di farlo. Per far funzionare correttamente il componente aggiuntivo è necessario Strumenti> Formato archivio Mozilla e modificare l'impostazione (terribile) predefinita di "eseguire un'istantanea fedele della pagina" per "conservare gli script e l'origine utilizzando Salva completo", altrimenti il componente aggiuntivo svuoterà tutto i tuoi file di script e sostituiscili con il testo "/ * Script rimosso dallo snapshot save * /".