概述
在实际抓取网页内容的时候,需要实时的调试xpath,查看它的捕获结果是否准备。
下面是三种方式,可以根据需要自行使用。
方式1:自带搜索框执行XPath表达式
- 按
F12
打开调试窗口 - 按
CTRL+F
打开搜索窗口 - 输入xpath表达式,即可开始定位元素
优点:简单方便
缺点:如上图所示,xpath表达式同样会被当作字符串进行搜索。
只要含有和xpath表达式一样的字符串,也会被搜索到。
方式2:Console命令执行XPath表达式(推荐)
- 按F12打开控制台
- 执行下面的命令,运行xpath表达式:
$x("//div[@class='user-info ']")
如果要使用css表达式搜索,则命令为:$$(“head”)
这种方式个人比较喜欢,因为能一次性看到所有的匹配结果,而且方便再次通过js过滤。
语法
**$x(path [, startNode])**
startNode是可选参数,如果没有的话,就会从根节点开始搜索。 有的话,则从startNode开始搜索。
参考:
Chrome XPath官方文档介绍
XPath queries in Google Chrome console
方式3:通过插件调试(不推荐)
下载地址
https://chrome.google.com/webstore/detail/xpath-helper/hgimnogjllphhhkhlmebbmlgjoejdpjl
直接使用chrome和谐安装的时候总是失败,后面改用edge安装了这款插件。
使用方式
- 点击浏览器右上角的
按钮,可以调出xpath的界面。
以淘宝网举例,如下所示:
- 输入xpath表达式,可以在右边看到结果:
这里需要注意的是,如果xpath的结果不包含文本,则不会显示出内容,只显示获取到结果结果!!!
参考
Evaluate and validate XPath/CSS selectors in Chrome Developer Tools
前两种方式都是整理自这篇文章,我自己原先用的是插件这种方式,惭愧!