Utilizzando un browser Web (IE o Chrome) posso salvare una pagina Web (.html) con Ctl-S, ispezionarla con qualsiasi editor di testo e visualizzare i dati in un formato tabella. Uno di quei numeri che voglio estrarre, ma per molte, molte pagine Web, troppe da fare manualmente. Quindi mi piacerebbe usare WGET per ottenere quelle pagine web una dopo l'altra, e scrivere un altro programma per analizzare il .html e recuperare il numero che desidero. Ma il file .html salvato da WGET quando si utilizza lo stesso URL del browser non contiene la tabella dei dati. Perchè no? È come se il server rilevi che la richiesta proviene da WGET e non da un browser Web e fornisce una pagina Web scheletro priva della tabella dei dati. Come posso ottenere la stessa identica pagina Web con WGET? - Grazie!
ULTERIORI INFORMAZIONI:
Un esempio dell'URL che sto cercando di recuperare è: http://performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&culture=en-US dove la stringa ICENX è un simbolo di ticker di fondi comuni di investimento , che cambierò in uno qualsiasi dei diversi simboli ticker. Questo scarica una tabella di dati quando viene visualizzata in un browser, ma la tabella di dati manca se recuperata con WGET.