要获取那种异步加载的网页 html 可以使用 selenium 加载网页,然后得到 html 后用 jsop 解析

    1. package com.meshop.crm;
    2. import org.jsoup.Jsoup;
    3. import org.jsoup.nodes.Document;
    4. import org.jsoup.select.Elements;
    5. import org.openqa.selenium.WebDriver;
    6. import org.openqa.selenium.chrome.ChromeDriver;
    7. import org.openqa.selenium.firefox.FirefoxDriver;
    8. import java.io.IOException;
    9. public class DemoTest {
    10. public static void main(String[] args) throws IOException {
    11. WebDriver driver = new ChromeDriver();
    12. driver.get("https://www.chinamoney.com.cn/chinese/sddshl/");
    13. // Document doc = Jsoup.connect("https://www.chinamoney.com.cn/chinese/sddshl/").get();
    14. final Document doc = Jsoup.parse(driver.getPageSource());
    15. final Elements elementsByAttribute = doc.getElementsByAttribute("data-value=\"USD/CNY\"");
    16. System.out.println();
    17. }
    18. }

    比如上面这个,但是这个有一个缺点就是需要依赖 本地 无头浏览器程序,所以还需要下载配置套系统的浏览器程序,上面代码