第二次作业（天气预报完善） - 第二次作业(酷狗音乐) - 《爬虫知识库》

import requests
import re
import csv
url = 'https://www.kugou.com/yy/html/rank.html'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.60 Safari/537.36 Edg/100.0.1185.29'
}
response = requests.get(url, headers=headers)
# response.encoding = 'utf-8'
html = response.text
# print(html)
result = re.match(r'.*(<ul>.*?</ul>).*', html, re.S)
# print(result.group(1))
res = result.group(1)
lis = re.findall(r'<li class.*?>.*?<span class="pc_temp_tips_r">', res, re.S)
# print(lis)
pattern = re.compile(r'<li class=" " title="(.*?)" data-index=".*?">.*?<.*?href="(.*?)" .*?>.*?.*?</span>.*?<span class="pc_temp_tips_r">', re.S)
lst = []
for i in lis:
    r = pattern.match(i)
    zu = (r.group(1), r.group(2))  # 元组元素
    lst.append(zu)
# print(lst)
with open('song.csv', 'w', encoding='utf-8') as f:
    writer = csv.writer(f)
    writer.writerow(['歌手--歌名', '歌曲链接'])
    writer.writerows(lst)