Se si utilizza l'espansione del controvento con wget
, è possibile recuperare facilmente le immagini numerate in sequenza:
$ wget 'http://www.iqandreas.com/sample-images/100-100-color/'{90..110}'.jpg'
Si va a prendere i primi 10 file numerati 90.jpg
per 99.jpg
bene, ma 100.jpg
e poi restituire un 404: file non trovato errore (ho solo 100 immagini memorizzate sul server). Questi file inesistenti diventano più "problematici" se si utilizza un intervallo più ampio, ad esempio {00..200}
con 100 file inesistenti, aumenta il tempo di esecuzione dello script e potrebbe persino diventare un leggero onere (o almeno un fastidio) per il server.
C'è un modo per wget
fermarsi dopo aver ricevuto il suo primo errore 404? (o meglio, due di fila, nel caso in cui ci fosse un file mancante nell'intervallo per un altro motivo) La risposta non ha bisogno di usare l'espansione del controvento; anche i loop vanno bene.
1, 2 or even n failures
non è il modo giusto quando conosci gli[begin .. end]
indici. Perché dovresti specificare l'[1..200]
intervallo quando sai che ci sono solo 100 immagini in[1..100]
. Immagino che tu possa provare GNUparallel
per richieste simultanee per accelerare il processo.