从Web获取并解析HTML文档,并在其中查找数据
使用[Jsoup.connect(String url)](https://jsoup.org/apidocs/org/jsoup/Jsoup.html#connect-java.lang.String-)
方法:
Document doc = Jsoup.connect("http://example.com/").get();
String title = doc.title();
描述
该[connect(String url)](https://jsoup.org/apidocs/org/jsoup/Jsoup.html#connect-java.lang.String-)
方法创建一个新的[Connection](https://jsoup.org/apidocs/org/jsoup/Connection.html)
,并[get()](https://jsoup.org/apidocs/org/jsoup/helper/HttpConnection.html#get--)
提取和解析HTML文件。如果在获取URL时发生错误,它将抛出一个IOException
,您应该适当处理。
该[Connection](https://jsoup.org/apidocs/org/jsoup/Connection.html)
接口设计用于方法链接以构建特定请求:
Document doc = Jsoup.connect("http://example.com")
.data("query", "Java")
.userAgent("Mozilla")
.cookie("auth", "token")
.timeout(3000)
.post();
此方法仅支持Web URL(http
和https
协议); 如果需要从文件加载,请改用该[parse(File in, String charsetName)](https://jsoup.org/apidocs/org/jsoup/Jsoup.html#parse-java.io.File-java.lang.String-)
方法。