1 Selenium 介绍

Selenium 项目最早是为了测试浏览器、网页而诞生的,而在大数据的时代,Selenium 则被广泛应用于网络爬虫。

Selenium-Webdriver 是 Selenium 项目基于浏览器的一部分,它的灵活性很强,几乎支持所有主流的浏览器甚至包括一些很小众的浏览器 。但请切记不要轻易更换你的 Webdriver 调用的浏览器,Selenium-Webdriver 对浏览器的
操作是通过浏览器原生的 api 来实现, 因不同浏览器 Web 元素的实现和呈现方法不同,Selenium-Webdriver 也要分不同的浏览器而提供不同的实现方法。

Selenium 的项目历史上存在着三个重大版本,selenium1.0,selenium2.0,selenium3.0。selenium1.0 和selenium2.0 最大区别就在于 webdriver,在 selenium 官方网页上有这样一个等式:
Selenium 1.0 + WebDriver = Selenium 2.0

2 Selenium 环境

2.1 Win 下安装 Se

  • 安装 selenium 库

    1. pip install selenium
  • 安装浏览器驱动

Selenium 可以模拟人类操纵浏览器的行为。so,在启动浏览器之前,需要下载一个 Webdriver ,它是驱动浏览器运行的一个工具。

谷歌浏览器 webdriver 的官方下载地址:https://sites.google.com/a/chromium.org/chromedriver/ 国内淘宝网站镜像提供的webdriver 地址:http://npm.taobao.org/mirrors/chromedriver/
# firefox_webdriver:https://github.com/mozilla/geckodriver/releases Selenium 承认的第三方驱动:https://www.selenium.dev/downloads/

配置环境变量
将下载的chromedriver.exe 文件目录添加到环境变量,一般为了便于管理或方便,将其放在python的安装目录(这个目录已经添加过环境变量),或放在Google的安装目录下(C:\Program Files (x86)\Google\Chrome\Application )并添加环境变量。

2.2 Selenium 基本使用

  1. from selenium import webdriver
  2. url = r'https://www.baidu.com/'
  3. driver = webdriver.Chrome() # 打开浏览器
  4. driver.get(url) # 打开网站
  5. driver.quit() # 关闭浏览器