代码
# 参考:https://blog.csdn.net/johnchiao/article/details/83959089#!/usr/bin/python# -*- coding: <encoding name> -*-import timefrom selenium import webdriverimport recomment_list = [] # 定义评论列表文件browser = webdriver.Chrome()url = 'https://music.163.com/song?id=168091' # 输入需要抓取网易音乐的单曲页面browser.get(url)browser.implicitly_wait(5)browser.switch_to.frame('contentFrame') # 进入framefor x in range(6): # 64是需要抓取的页面总数***button = browser.find_element_by_link_text('下一页') # 通过找到‘下一页’的按钮进行翻页time.sleep(2)#print(button.text)aa = browser.find_elements_by_xpath('//div/div[2]/div[1]/div[1]') # 定位评论文字for i in aa:#print(i.text)a = re.search(':', i.text) # 通过正则表达式进行“:”定位,得出左边是评论者,这个要去掉#print(a)if a:n = i.text.index(':') + 1m = i.text[n:] # 只保留从“:”右边的文字,就是纯正的评论文字comment_list.append(m)else:#comment_list.append('')print('继续工作......')print('抓取了>>>>' + str(x) + '<<<<页')button.click() # 自动进行“下一页”的按钮with open('F:/music/music.txt','a',encoding = 'utf-8') as f: # 保存文本文件f.write(str(comment_list))
遇到的问题
webdrive
https://sites.google.com/a/chromium.org/chromedriver/home
1.我的浏览器
2.下载的webdriver
3.


