1. 作业1

  • 目标网站:https://fanyi.baidu.com/
  • 爬取要求:

    ○ 1、输入要翻译的内容
    ○ 2、通过post请求拿到json数据(可以用urllib模块,也可以用requests模块)
    ○ 3、把翻译后的数据提取出来,直接打印到控制台就行

    代码:

    import json
    import requests

url=”https://fanyi.baidu.com/v2transapi?from=en&to=zh
while True:
try:
word=input(“请输入你要翻译的单词:”)
datas ={
“kw”:word}
header={“User-Agent”: “Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Mobile Safari/537.36”}
response=requests.post(“https://fanyi.baidu.com/sug"**,**data=datas**,**headers=header)
result=response.content.decode()
result=json.loads(result)

  1. print(result["data"][**0**]["v"])<br /> except Exception as e:<br /> print('不会翻译')

作业二

● 目标网站:https://haokan.baidu.com/
● 爬取要求:
○ 1、输入搜索内容
○ 2、拿到对应内容的视频的名字和链接(不要求全部拿到)
○ 3、把内容提取出来,直接打印到控制台即可

代码:

from fake_useragent import UserAgent
import re
import requests

url = f”https://haokan.baidu.com/web/search/api?pn=1&rn=10&type=video&query={input('请输入你要搜索到内容')}
headers = {
‘User-Agent’ : UserAgent().chrome
}

resp=requests.get(url)

page=resp.content.decode(‘unicode_escape’)

titles=re.findall(‘“title”:”(.?)”‘,page)
url_vids=re.findall(‘vid=(.
?)”‘,page)

url_mv=”https://haokan.baidu.com/v?vid=

print(page)
for title,url_vid in zip(titles,url_vids):
print(title,url_mv+url_vid)