作者: pingc

Jpage其他API

  1. //获取请求返回内容
  2. String content = jPage.getContent();
  3. //获取请求响应码
  4. Integer code = jPage.getCode();
  5. //获取所有响应头
  6. Header[] headers = jPage.getHeaders();
  7. //获取返回的字节数组(只限get)
  8. String bytes = jPage.getBytes();
  9. //获取指定响应头
  10. String name = jPage.getHeader("name");
  11. //获取请求url
  12. String url = jPage.getUrl();
  13. //获取最新url
  14. String redUrl = jPage.getRedUrl();
  15. //添加一个继续爬取url(配合JProcessor处理器使用)
  16. jPage.addGoUrl("https://baidu.com");
  17. //添加多个继续爬取url(配合JProcessor处理器使用)
  18. jPage.addGoUrls(new List<Stirng>());
  19. //获取客户端抓取队列url(配合JProcessor处理器使用)
  20. List<String> goUrl = jPage.getGoUrl();
  21. //存储数据,同一个JProcessor中,可用于多线程下传输数据
  22. jPage.setTag("age",18);
  23. //获取数据,同一个JProcessor中,可用于多线程下传输数据
  24. jPage.getTag("age");
  25. //xpath解析
  26. jPage.xpath("//h1/text()");
  27. //正则提取
  28. jPage.regex("(<h1.*?>)");
  29. //正则替换全部
  30. jPage.replaceAll("h1","h2");
  31. //正则替换第一个
  32. Page.replaceFirst("h1","h2");
  33. //css选择器
  34. Page.getSelector()
  35. //对结果去空格,去空值
  36. Page.xpath("//h1/text()").trim();