1. 作业1

  • 目标网站:https://fanyi.baidu.com/
  • 爬取要求:

    ○ 1、输入要翻译的内容
    ○ 2、通过post请求拿到json数据(可以用urllib模块,也可以用requests模块)
    ○ 3、把翻译后的数据提取出来,直接打印到控制台就行
    代码:
    import requests

url = ‘https://fanyi.baidu.com/sug

headers = {
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ‘
‘Chrome/95.0.4638.69 Safari/537.36 ‘
}
word = input(‘请输入想要翻译的语音和句子:’)
data = {
‘kw’: word
}
response = requests.post(url=url, data=data, headers=headers)

data_obj = response.json()

print(data_obj)

作业二

● 目标网站:https://haokan.baidu.com/
● 爬取要求:
○ 1、输入搜索内容
○ 2、拿到对应内容的视频的名字和链接(不要求全部拿到)
○ 3、把内容提取出来,直接打印到控制台即可
代码:
import requests

name = input(‘请输入关键字:’)
url = f’https://haokan.baidu.com/web/search/api?pn=1&rn=10&type=video&query={name}
headers = {
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ‘
‘Chrome/95.0.4638.69 Safari/537.36 ‘
}
response = requests.get(url=url, headers=headers).json()

tit_li = response[‘data’][‘list’]
# print(tit_li)
for url1 in tit_li:
title = url1[‘title’] # 视频标题
url_src = url1[‘url’] # 视频链接
print(title, url_src)