作者: pingc
请求web页面后会返回的一个Jpage对象,它存储着本次请求的所有信息,并且可以通过它进行对内容的解析。
Jpage支持:
Xpath(支持2.0)语法
正则表达式 提取/替换
css选择器提取
Xpath(推荐)
//创建请求客户端JHtml jHtml = new JHtml();//发起get请求JPage jPage = jHtml.get("http://localhost");/*** xpath提取内容* getAll返回所有匹配内容* get返回第一个匹配内容**/List<String> h1s = jPage.xpath("//h1/text()").getAll();String h1 = jPage.xpath("//h1/text()").get();//打印返回内容System.out.println("全部匹配:"+h1s+",第一个匹配:"+h1);
正则表达式提取
//创建请求客户端JHtml jHtml = new JHtml();//发起get请求JPage jPage = jHtml.get("http://localhost");/*** 正则表达式提取内容**/List<String> h1s = jPage.regex("(<h1.*?>)").getAll();//打印返回内容System.out.println("正则提取:"+h1s);
正则表达式替换
//创建请求客户端JHtml jHtml = new JHtml();//发起get请求JPage jPage = jHtml.get("http://localhost");/*** 正则表达式替换内容* replaceAll替换所有符合内容* replaceFirst替换第一个符合内容* h1替换为h2**/List<String> h1All = jPage.replaceAll("h1","h2").getAll();List<String> h1First = jPage.replaceFirst("h1","h2").getAll();//打印返回内容System.out.println("全部替换:"+h1All+",替换一个:"+h1First);
css选择器
//创建请求客户端JHtml jHtml = new JHtml();//发起get请求JPage jPage = jHtml.get("http://localhost");/*** css选择器* 返回的是jsoup的选择器,并没有做api封装**/Document selector = jPage.getSelector();//获取所有h1标签Elements h1 = selector.getElementsByClass("h1");//获取第一个h1标签的内容String h1text = h1.next().text();//打印返回内容System.out.println("第一个H1:"+h1text);
