• https://www.kugou.com/yy/html/rank.html
    # ● 爬取要求:
    # ○ 1、获取到榜单页面的源码
    # ○ 2、用正则解析数据,获取到该页面所有歌曲的名字(包括歌手)和页面链接
    # ○ 3、把数据保存到csv
    _’’’
    .*?
    ‘’’">1.作业一
    # ● 目标网站:https://www.kugou.com/yy/html/rank.html
    # ● 爬取要求:
    # ○ 1、获取到榜单页面的源码
    # ○ 2、用正则解析数据,获取到该页面所有歌曲的名字(包括歌手)和页面链接
    # ○ 3、把数据保存到csv
    _’’’
    .*?
    ‘’’
  • print(response.text)

    1.作业一
    # ● 目标网站:https://www.kugou.com/yy/html/rank.html
    # ● 爬取要求:
    # ○ 1、获取到榜单页面的源码
    # ○ 2、用正则解析数据,获取到该页面所有歌曲的名字(包括歌手)和页面链接
    # ○ 3、把数据保存到csv
    _’’’
    .*?
    ‘’’

    _import requests
    import re
    import csv

    url = ‘https://www.kugou.com/yy/html/rank.html

    headers = {
    ‘user-agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36’
    }

    response = requests.get(url, headers=headers)

    print(response.text)

    dag = re.findall(‘

      .?
    ‘,response.content.decode(‘utf-8’), re.S)[1]
    # print(dag)
    dag2 = re.findall(‘<li.
    ?‘,dag,re.S)
    # print(dag2)
    for dag in dag2:
    # print(dag)
    dag3 = re.findall(‘.*?‘, dag, re.S)[0]
    cc = “网页url:”+dag3[0]+”歌名:”+dag3[1]
    print(cc)