Ho la seguente pagina
http://www.fda.gov/downloads/scienceresearch/fieldscience/laboratorymanual/ucm092156.pdf
Mi piacerebbe trovare le pagine su www.fda.gov che rimandino a questa pagina? Come lo posso fare?
Ho la seguente pagina
http://www.fda.gov/downloads/scienceresearch/fieldscience/laboratorymanual/ucm092156.pdf
Mi piacerebbe trovare le pagine su www.fda.gov che rimandino a questa pagina? Come lo posso fare?
Risposte:
Puoi usare wget
per scaricare ricorsivamente l'intero sito Web:
wget --recursive --page-requisites --html-extension --no-parent --domains
www.fda.gov www.fda.gov
È quindi possibile utilizzare egrep
per cercare ricorsivamente tra tutti i file per trovare quali pagine collegano a ucm092156.pdf:
egrep -r -o '*ucm092156.pdf' www.fda.gov/
--limit-rate
bandiera per ridurre le possibilità che ciò accada. Per esempio, --limit-rate=100k
ridurrà la velocità di download a 100 KB / sec
grep -rl '*ucm092156.pdf' www.fda.gov/
su mac fa lo stesso lavoro. (ancora aspettando che finisca il download, ma sembra buono fino ad ora)