https://www.kugou.com/yy/html/rank.html
# ● 爬取要求：
# ○ 1、获取到榜单页面的源码
# ○ 2、用正则解析数据，获取到该页面所有歌曲的名字(包括歌手)和页面链接
# ○ 3、把数据保存到csv
_’’’
.*?
‘’’">1.作业一
# ● 目标网站：https://www.kugou.com/yy/html/rank.html
# ● 爬取要求：
# ○ 1、获取到榜单页面的源码
# ○ 2、用正则解析数据，获取到该页面所有歌曲的名字(包括歌手)和页面链接
# ○ 3、把数据保存到csv
_’’’
.*?
‘’’
print(response.text)

rank.html
# ● 爬取要求：
# ○ 1、获取到榜单页面的源码
# ○ 2、用正则解析数据，获取到该页面所有歌曲的名字(包括歌手)和页面链接
# ○ 3、把数据保存到csv
_’’’
.*?
‘’’

_import requests
import re
import csv

url = ‘https://www.kugou.com/yy/html/rank.html‘

headers = {
‘user-agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36’
}

response = requests.get(url, headers=headers)

print(response.text)

dag = re.findall(‘

‘,response.content.decode(‘utf-8’), re.S)[1]
# print(dag)
dag2 = re.findall(‘<li.?‘,dag,re.S)
# print(dag2)
for dag in dag2:
# print(dag)
dag3 = re.findall(‘.*?‘, dag, re.S)[0]
cc = “网页url：”+dag3[0]+”歌名：”+dag3[1]
print(cc)

爬虫作业

作业五

1.作业一
# ● 目标网站：https://www.kugou.com/yy/html/rank.html
# ● 爬取要求：
# ○ 1、获取到榜单页面的源码
# ○ 2、用正则解析数据，获取到该页面所有歌曲的名字(包括歌手)和页面链接
# ○ 3、把数据保存到csv
_’’’
.*?
‘’’

print(response.text)

作业五

1.作业一# ● 目标网站：https://www.kugou.com/yy/html/rank.html# ● 爬取要求：# ○ 1、获取到榜单页面的源码# ○ 2、用正则解析数据，获取到该页面所有歌曲的名字(包括歌手)和页面链接# ○ 3、把数据保存到csv_’’’.*?‘’’

print(response.text)

1.作业一
# ● 目标网站：https://www.kugou.com/yy/html/rank.html
# ● 爬取要求：
# ○ 1、获取到榜单页面的源码
# ○ 2、用正则解析数据，获取到该页面所有歌曲的名字(包括歌手)和页面链接
# ○ 3、把数据保存到csv
_’’’
.*?
‘’’