Ho bisogno di analizzare (lato server) grandi quantità di pagine HTML.
Siamo tutti d'accordo che regexp non è la strada da percorrere qui.
Mi sembra che javascript sia il modo nativo di analizzare una pagina HTML, ma questa ipotesi si basa sul codice lato server che ha tutte le capacità DOM che javascript ha all'interno di un browser.
Node.js ha questa capacità integrata?
Esiste un approccio migliore a questo problema, analizzando l'HTML sul lato server?