Domande taggate «jsoup»

15
Come faccio a preservare le interruzioni di riga quando utilizzo jsoup per convertire HTML in testo normale?
Ho il codice seguente: public class NewClass { public String noTags(String str){ return Jsoup.parse(str).text(); } public static void main(String args[]) { String strings="<!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN \">" + "<HTML> <HEAD> <TITLE></TITLE> <style>body{ font-size: 12px;font-family: verdana, arial, helvetica, sans-serif;}</style> </HEAD> <BODY><p><b>hello world</b></p><p><br><b>yo</b> <a href=\"http://google.com\">googlez</a></p></BODY> </HTML> "; NewClass text …
101 java  jsoup 

6
Ottengo un'eccezione SocketTimeoutException in Jsoup: lettura scaduta
Ottengo un'eccezione SocketTimeoutException quando provo ad analizzare molti documenti HTML utilizzando Jsoup. Ad esempio, ho un elenco di link: <a href="www.domain.com/url1.html">link1</a> <a href="www.domain.com/url2.html">link2</a> <a href="www.domain.com/url3.html">link3</a> <a href="www.domain.com/url4.html">link4</a> Per ogni collegamento, analizzo il documento collegato all'URL (dall'attributo href) per ottenere altre informazioni in quelle pagine. Quindi posso immaginare che ci voglia …
100 java  jsoup 
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.