PPT资源:WS01-Requests库入门.pdf

1.requests安装

pip install requests
注:pip升级不要直接win+R然后cmd,而是要选择“开始”—“Windows系统”—“命令提示符”—右键“以管理员身份运行”

  1. python -m pip install --upgrade pip
  2. pip升级命令
  3. pip install -U pip

2.Response对象的属性

image.png

  1. import requests
  2. r = requests.get("http://www.baidu.com")
  3. print(r.status_code)
  4. #以下输出的是乱码
  5. print(r.text)
  6. #以下显示是ISO-8859-1编码
  7. print(r.encoding)
  8. #以下显示是utf-8编码
  9. print(r.apparent_encoding)

image.png

  1. import requests
  2. r = requests.get("http://www.baidu.com")
  3. print(r.status_code)
  4. #以下输出的是乱码
  5. print(r.text)
  6. #以下显示是ISO-8859-1编码
  7. print(r.encoding)
  8. #以下显示是utf-8编码
  9. print(r.apparent_encoding)
  10. #将编码转换为utf-8
  11. r.encoding = 'utf-8'
  12. print(r.text)

3.Requests库的方法

image.png

爬虫通用代码框架

  1. #爬虫通用代码框架
  2. import requests
  3. def pachong(url):
  4. try:
  5. r = requests.get(url, timeout=30)
  6. r.raise_for_status()
  7. r.encoding = r.apparent_encoding
  8. return r.text
  9. except:
  10. return "产生异常"
  11. # if __name__ == "_main_":
  12. # url = "https://www.baidu.com"
  13. # print(pachong(url))
  14. print(pachong("https://www.baidu.com"))