jsoup - 从URL地址中解析文档 - 《编程指南》

描述

从Web获取并解析HTML文档，并在其中查找数据
使用[Jsoup.connect(String url)](https://jsoup.org/apidocs/org/jsoup/Jsoup.html#connect-java.lang.String-)方法：

Document doc = Jsoup.connect("http://example.com/").get();
String title = doc.title();

描述

该[connect(String url)](https://jsoup.org/apidocs/org/jsoup/Jsoup.html#connect-java.lang.String-)方法创建一个新的[Connection](https://jsoup.org/apidocs/org/jsoup/Connection.html)，并[get()](https://jsoup.org/apidocs/org/jsoup/helper/HttpConnection.html#get--)提取和解析HTML文件。如果在获取URL时发生错误，它将抛出一个IOException，您应该适当处理。
该[Connection](https://jsoup.org/apidocs/org/jsoup/Connection.html)接口设计用于方法链接以构建特定请求：

Document doc = Jsoup.connect("http://example.com")
  .data("query", "Java")
  .userAgent("Mozilla")
  .cookie("auth", "token")
  .timeout(3000)
  .post();

此方法仅支持Web URL（http和https协议）; 如果需要从文件加载，请改用该[parse(File in, String charsetName)](https://jsoup.org/apidocs/org/jsoup/Jsoup.html#parse-java.io.File-java.lang.String-)方法。