要获取那种异步加载的网页 html 可以使用 selenium 加载网页,然后得到 html 后用 jsop 解析
package com.meshop.crm;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.firefox.FirefoxDriver;
import java.io.IOException;
public class DemoTest {
public static void main(String[] args) throws IOException {
WebDriver driver = new ChromeDriver();
driver.get("https://www.chinamoney.com.cn/chinese/sddshl/");
// Document doc = Jsoup.connect("https://www.chinamoney.com.cn/chinese/sddshl/").get();
final Document doc = Jsoup.parse(driver.getPageSource());
final Elements elementsByAttribute = doc.getElementsByAttribute("data-value=\"USD/CNY\"");
System.out.println();
}
}
比如上面这个,但是这个有一个缺点就是需要依赖 本地 无头浏览器程序,所以还需要下载配置套系统的浏览器程序,上面代码