1. 作业1

目标网站：https://fanyi.baidu.com/
爬取要求：

○ 1、输入要翻译的内容
○ 2、通过post请求拿到json数据（可以用urllib模块，也可以用requests模块）
○ 3、把翻译后的数据提取出来，直接打印到控制台就行
代码：
import requests

headers = {
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ‘
‘Chrome/95.0.4638.69 Safari/537.36 ‘
}
word = input(‘请输入想要翻译的语音和句子：’)
data = {
‘kw’: word
}
response = requests.post(url=url, data=data, headers=headers)

data_obj = response.json()

print(data_obj)

作业二

● 目标网站：https://haokan.baidu.com/
● 爬取要求：
○ 1、输入搜索内容
○ 2、拿到对应内容的视频的名字和链接（不要求全部拿到）
○ 3、把内容提取出来，直接打印到控制台即可
代码：
import requests

name = input(‘请输入关键字:’)
url = f’https://haokan.baidu.com/web/search/api?pn=1&rn=10&type=video&query={name}‘
headers = {
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ‘
‘Chrome/95.0.4638.69 Safari/537.36 ‘
}
response = requests.get(url=url, headers=headers).json()

tit_li = response[‘data’][‘list’]
# print(tit_li)
for url1 in tit_li:
title = url1[‘title’] # 视频标题
url_src = url1[‘url’] # 视频链接
print(title, url_src)

22期爬虫作业

第二次作业02.11

1. 作业1

作业二