- https://www.kugou.com/yy/html/rank.html
# ● 爬取要求:
# ○ 1、获取到榜单页面的源码
# ○ 2、用正则解析数据,获取到该页面所有歌曲的名字(包括歌手)和页面链接
# ○ 3、把数据保存到csv
_’’’.*?
‘’’">1.作业一
# ● 目标网站:https://www.kugou.com/yy/html/rank.html
# ● 爬取要求:
# ○ 1、获取到榜单页面的源码
# ○ 2、用正则解析数据,获取到该页面所有歌曲的名字(包括歌手)和页面链接
# ○ 3、把数据保存到csv
_’’’.*?
‘’’ - print(response.text)
1.作业一
# ● 目标网站:https://www.kugou.com/yy/html/rank.html
# ● 爬取要求:
# ○ 1、获取到榜单页面的源码
# ○ 2、用正则解析数据,获取到该页面所有歌曲的名字(包括歌手)和页面链接
# ○ 3、把数据保存到csv
_’’’
.*?
‘’’
‘’’
_import requests
import re
import csv
url = ‘https://www.kugou.com/yy/html/rank.html‘
headers = {
‘user-agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36’
}
response = requests.get(url, headers=headers)
print(response.text)
dag = re.findall(‘
- .?
# print(dag)
dag2 = re.findall(‘<li.?‘,dag,re.S)
# print(dag2)
for dag in dag2:
# print(dag)
dag3 = re.findall(‘
cc = “网页url:”+dag3[0]+”歌名:”+dag3[1]
print(cc)
