1、selenium

selenium是一个web的自动化测试工具,最初是为网站自动化测试而开发的,selenium可以直接运行在浏览器上,它支持所有主流的浏览器,可以接收指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏;

2、chromedriver

chromedriver是一个驱动Chrome浏览器的驱动程序,使用它selenium才可以驱动Chrome浏览器。当然针对不同的浏览器有不同的driver。以下列出了不同浏览器及其对应的driver:

Chrome:https://sites.google.com/a/chromium.org/chromedriver/downloads

Firefox:https://github.com/mozilla/geckodriver/releases

Edge:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/

Safari:https://webkit.org/blog/6900/webdriver-support-in-safari-10/

3、phantomjs

Phantomjs是一个基于webkit的”无界面”浏览器,它会把网站加载到内存并执行页面上的JavaScript;现已停止更新;不需要向其他浏览器一样要驱动来操作浏览器;

4、下载chromedriver

5、安装Selenium和chromedriver:

安装Selenium

  1. pip install selenium

安装chromedriver:下载完成后,放到不需要权限的纯英文目录下就可以了,建议放在Python.exe的同级目录下(相当于放入了环境变量中)。