Sto pensando di provare Beautiful Soup , un pacchetto Python per lo scraping HTML. Ci sono altri pacchetti di scraping HTML che dovrei guardare? Python non è un requisito, in realtà sono interessato a conoscere anche altre lingue.
La storia così lontana:
- Pitone
- Rubino
- .NETTO
- Perl
- Giava
- JavaScript
- PHP
- La maggior parte di loro
XPathExpression
possibile utilizzare quello di Java (che esiste da Java 1.5)