作者: pingc
Jpage其他API
//获取请求返回内容String content = jPage.getContent();//获取请求响应码Integer code = jPage.getCode();//获取所有响应头Header[] headers = jPage.getHeaders();//获取返回的字节数组(只限get)String bytes = jPage.getBytes();//获取指定响应头String name = jPage.getHeader("name");//获取请求urlString url = jPage.getUrl();//获取最新urlString redUrl = jPage.getRedUrl();//添加一个继续爬取url(配合JProcessor处理器使用)jPage.addGoUrl("https://baidu.com");//添加多个继续爬取url(配合JProcessor处理器使用)jPage.addGoUrls(new List<Stirng>());//获取客户端抓取队列url(配合JProcessor处理器使用)List<String> goUrl = jPage.getGoUrl();//存储数据,同一个JProcessor中,可用于多线程下传输数据jPage.setTag("age",18);//获取数据,同一个JProcessor中,可用于多线程下传输数据jPage.getTag("age");//xpath解析jPage.xpath("//h1/text()");//正则提取jPage.regex("(<h1.*?>)");//正则替换全部jPage.replaceAll("h1","h2");//正则替换第一个Page.replaceFirst("h1","h2");//css选择器Page.getSelector()//对结果去空格,去空值Page.xpath("//h1/text()").trim();
