为什么要学python?

到百度上搜 百度指数
image.png

这时2020年2月16日,在百度上看到java 和python 对比搜索情况的数据。

HTTP 协议

一种发布和接受HTML 页面的方法

HTTPS协议

安全的http协议,在HTTP下加入SSL层
SSL 主要用于web的安全传输协议,在传输层对网络连接进行加密,保障在Internet上数据传输的安全

HTTP端口号为80
https端口号为443

统一资源定位符
URL
Scheme: 表示协议
host : 表示IP地址或域名
port# :端口号码
path :访问资源的路径
query-string 参数,发送给http服务器的数据
anchor :锚,跳转到网页指定锚点的位置,request不会再发送请求。

常用的请求报头

host
connection ,表示客户端和服务器端的连接类型
1、客户端发起一个包含 keep-alive 的请求,keep-alive为默认值 ,http 1.1版本 默认值是 keep -alive
2 服务器端收到请求后,是否支持 keep alive,如果不支持,回复一个close.

update insecure-requests 升级为https请求,表示升级

User-Agent:表示客户浏览器的名称 ,可以是手机端,也可以是PC端浏览器。

  1. Accept: 表示传输的文件类型,如下
    text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,/;q=0.8,application/signed-exchange;v=b3;q=0.9
  2. Accept-Encoding:
    gzip, deflate, br
  3. Accept-Language:
    zh-CN,zh;q=0.9
  4. Cache-Control:
    max-age=0
  5. Connection:
    keep-alive

状态吗
200 表示请求成功
302 临时
307 使用缓存资源
404 页面没找着
403 权限不够
500 服务器错误

如何请求的url 结果 汉字显示正常?

如下两个代码 等价,结果一样
r=request.get(‘www.baidu.com’)
r.content.decode(‘utf-8’)
r=request.get(‘www.baidu.com’)
r.decode(‘utf-8’)