一、学习资料

视频:
B站 - 【爬虫入门】selenium爬取动态网页,以及常见的问题
文档:
语雀 - 【爬虫入门】selenium爬取动态网页,以及常见的问题。
百度文库 - Chromedriver安装教程(简洁版)
「UI 测试自动化selenium」汇总

二、selenium简介

image.png

三、webbrowser

打开特定浏览器,批量打开表格中的网页

import webbrowser import xlrd

if name == ‘main‘:

  1. # 获取任意浏览器
  2. # LYPath = input("请输入LY全地址:")
  3. # LYPath = LYPath.replace('"', '')
  4. # LYPath = LYPath.replace('\\','/')
  5. LYPath = "全地址/lybrowser.exe"
  6. webbrowser.register('LY',None,webbrowser.BackgroundBrowser(LYPath))
  7. # webbrowser.get('LY').open_new_tab('[https://cn.bing.com/chrome/newtab](https://cn.bing.com/chrome/newtab)')
  8. # 获取数据
  9. excel_path = 'urls.xlsx'
  10. url_row = 0
  11. workbook = xlrd.open_workbook(excel_path)
  12. table = workbook.sheets()[0]
  13. i = 0
  14. nrows = table.nrows
  15. continue_flag = 'Y'
  16. # 批量打开网页
  17. while continue_flag != 'N' and i < nrows:
  18. for j in range(12):
  19. if i >= nrows:
  20. print(f'{i}个url已全部打开')
  21. break
  22. temp_url = table.cell(i,url_row).value
  23. webbrowser.get('LY').open_new_tab(temp_url)
  24. print(f'{i}:{temp_url} 已打开\n')
  25. i += 1
  26. if i < nrows:
  27. continue_flag = input('输入‘N’结束,任意键继续:')