Un grande difetto di curl
è che sempre più wepage stanno facendo dipingere il loro contenuto principale da una risposta JavaScript AJAX che si verifica dopo la risposta HTTP iniziale. curl
non raccoglie mai questo contenuto post-dipinto.
Quindi, per recuperare questi tipi di pagine Web dalla riga di comando, sono stato ridotto a scrivere script in Ruby che guidano SeleniumRC per avviare un'istanza di Firefox e quindi restituire il codice sorgente HTML dopo che queste chiamate AJAX sono state completate.
Sarebbe molto meglio avere una soluzione a riga di comando più snella per questo tipo di problema. Qualcuno ne sa qualcosa?