- 1. 作业1
- 代码:
- https://fanyi.baidu.com/v2transapi?from=en&to=zh“
while True:
try:
word=input(“请输入你要翻译的单词:”)
datas ={
“kw”:word}
header={“User-Agent”: “Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Mobile Safari/537.36”}
response=requests.post(“https://fanyi.baidu.com/sug"**,**data=datas**,**headers=header)
result=response.content.decode()
result=json.loads(result)">url=”https://fanyi.baidu.com/v2transapi?from=en&to=zh“
while True:
try:
word=input(“请输入你要翻译的单词:”)
datas ={
“kw”:word}
header={“User-Agent”: “Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Mobile Safari/537.36”}
response=requests.post(“https://fanyi.baidu.com/sug"**,**data=datas**,**headers=header)
result=response.content.decode()
result=json.loads(result) - 作业二
- 代码:
- print(page)
for title,url_vid in zip(titles,url_vids):
print(title,url_mv+url_vid)
1. 作业1
- 目标网站:https://fanyi.baidu.com/
爬取要求:
○ 1、输入要翻译的内容
○ 2、通过post请求拿到json数据(可以用urllib模块,也可以用requests模块)
○ 3、把翻译后的数据提取出来,直接打印到控制台就行代码:
import json
import requests
url=”https://fanyi.baidu.com/v2transapi?from=en&to=zh“
while True:
try:
word=input(“请输入你要翻译的单词:”)
datas ={
“kw”:word}
header={“User-Agent”: “Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Mobile Safari/537.36”}
response=requests.post(“https://fanyi.baidu.com/sug"**,**data=datas**,**headers=header)
result=response.content.decode()
result=json.loads(result)
print(result["data"][**0**]["v"])<br /> except Exception as e:<br /> print('不会翻译')
作业二
● 目标网站:https://haokan.baidu.com/
● 爬取要求:
○ 1、输入搜索内容
○ 2、拿到对应内容的视频的名字和链接(不要求全部拿到)
○ 3、把内容提取出来,直接打印到控制台即可
代码:
from fake_useragent import UserAgent
import re
import requests
url = f”https://haokan.baidu.com/web/search/api?pn=1&rn=10&type=video&query={input('请输入你要搜索到内容')}“
headers = {
‘User-Agent’ : UserAgent().chrome
}
resp=requests.get(url)
page=resp.content.decode(‘unicode_escape’)
titles=re.findall(‘“title”:”(.?)”‘,page)
url_vids=re.findall(‘vid=(.?)”‘,page)
url_mv=”https://haokan.baidu.com/v?vid=“