HTTP最常见的请求报文有两种:
1. GET 方式的请求报文: 获取web服务器数据
2. POST 方式的请求报文: 向web服务器提交数据(也可以 获取web服务器数据)

1 GET请求报文

  1. ---- 请求行 ----
  2. GET / HTTP/1.1 # GET请求方式 请求资源路径 HTTP协议版本
  3. ---- 请求头 -----
  4. Host: www.itcast.cn # 服务器的主机地址和端口号,默认是80
  5. Connection: keep-alive # 和服务端保持长连接
  6. Upgrade-Insecure-Requests: 1 # 让浏览器升级不安全请求,使用https请求
  7. User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36 # 用户代理,也就是客户端的名称
  8. Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8 # 可接受的数据类型
  9. Accept-Encoding: gzip, deflate # 可接受的压缩格式
  10. Accept-Language: zh-CN,zh;q=0.9 #可接受的语言
  11. Cookie: pgv_pvi=1246921728; # 登录用户的身份标识
  12. ---- 空行 ----

2 POST请求报文

  1. ---- 请求行 ----
  2. POST /xmweb?host=mail.itcast.cn&_t=1542884567319 HTTP/1.1 # POST请求方式 请求资源路径 HTTP协议版本
  3. ---- 请求头 ----
  4. Host: mail.itcast.cn # 服务器的主机地址和端口号,默认是80
  5. Connection: keep-alive # 和服务端保持长连接
  6. Content-Type: application/x-www-form-urlencoded # 告诉服务端请求的数据类型
  7. User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36 # 客户端的名称
  8. ---- 空行 ----
  9. ---- 请求体 ----
  10. username=hello&pass=hello # 请求参数

image.png

3 请求头字段

  • Host: 指定服务器的域名
  • Connection: 常用于要求服务端使用TCP长连接, HTTP/1.1默认是长连接, 但为了兼容老版本设置此字段, 一般都是Keep-Alive
  • Accept: 声明自己可以接受哪些数据格式, /代表接受任意类型
  • Accept-Encoding: 声明自己可以接受哪些压缩方法, 如gzip, deflate
  • User-Agent: 描述客户端是哪个浏览器或者是爬虫