从Web获取并解析HTML文档,并在其中查找数据
使用[Jsoup.connect(String url)](https://jsoup.org/apidocs/org/jsoup/Jsoup.html#connect-java.lang.String-)方法:
Document doc = Jsoup.connect("http://example.com/").get();String title = doc.title();
描述
该[connect(String url)](https://jsoup.org/apidocs/org/jsoup/Jsoup.html#connect-java.lang.String-)方法创建一个新的[Connection](https://jsoup.org/apidocs/org/jsoup/Connection.html),并[get()](https://jsoup.org/apidocs/org/jsoup/helper/HttpConnection.html#get--)提取和解析HTML文件。如果在获取URL时发生错误,它将抛出一个IOException,您应该适当处理。
该[Connection](https://jsoup.org/apidocs/org/jsoup/Connection.html)接口设计用于方法链接以构建特定请求:
Document doc = Jsoup.connect("http://example.com").data("query", "Java").userAgent("Mozilla").cookie("auth", "token").timeout(3000).post();
此方法仅支持Web URL(http和https协议); 如果需要从文件加载,请改用该[parse(File in, String charsetName)](https://jsoup.org/apidocs/org/jsoup/Jsoup.html#parse-java.io.File-java.lang.String-)方法。
