1、selenium
selenium是一个web的自动化测试工具,最初是为网站自动化测试而开发的,selenium可以直接运行在浏览器上,它支持所有主流的浏览器,可以接收指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏;
2、chromedriver
chromedriver是一个驱动Chrome浏览器的驱动程序,使用它selenium才可以驱动Chrome浏览器。当然针对不同的浏览器有不同的driver。以下列出了不同浏览器及其对应的driver:
Chrome:https://sites.google.com/a/chromium.org/chromedriver/downloads
Firefox:https://github.com/mozilla/geckodriver/releases
Edge:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
Safari:https://webkit.org/blog/6900/webdriver-support-in-safari-10/
3、phantomjs
Phantomjs是一个基于webkit的”无界面”浏览器,它会把网站加载到内存并执行页面上的JavaScript;现已停止更新;不需要向其他浏览器一样要驱动来操作浏览器;
4、下载chromedriver
百度搜索:淘宝镜像(https://npm.taobao.org/)
‘chromedriver’ executable needs to be in PATH`报错解决:https://www.jianshu.com/p/a383e8970135
5、安装Selenium和chromedriver:
安装Selenium
:
pip install selenium
安装chromedriver
:下载完成后,放到不需要权限的纯英文目录下就可以了,建议放在Python.exe的同级目录下(相当于放入了环境变量中)。