http走私攻击介绍

前端服务器(CDN)和后端服务器接收数据不同步，引起对客户端传入的数据理解不一致，从而导致漏洞的产生。

大多数HTTP请求走私漏洞的出现是因为HTTP规范提供了两种不同的方法来指定请求的结束为止：

Content-Length标头和Transfer-Encoding标头

同时使用两种不同的方法时，Content-Length的无效。当多个服务器时，对客户端传入的数据理解不一致时，就会出现有些服务器认为Content-Length的长度有效，有些Transfer-Encoding有效。

而一般情况下，反向代理服务器和后端源站服务器之间，会重用TCP链接（因为TCP会切割报文）。这样超出的长度就会拼接到下一次请求进行，从而导致HTTP请求走私漏洞。

HTTP协议解析漏洞：WAF进行模式匹配的时候都是对HTTP协议变量进行匹配，攻击者构造异常的HTTP数据包导致不能正常提取变量，都不能进入到模式匹配阶段，自然而然就绕过了。

HTTP请求走私攻击的5种方式

1.CL不为0

所有不携带请求体的http请求都有可能收到此影响。这里用GET举例。

前端代理服务器允许GET请求携带请求体；后端服务器不允许GET请求携带请求体，它就会直接忽略掉GET请求中的Content-Length头，不进行处理。这里就有可能导致请求走私。

构造请求示例：

\r\n是换行的意思，windows的换行是\r\n，unix的是\n，mac的是\r

攻击流程:

前端服务器收到该请求，读取Content-Length，判断这是一个完整的请求。

然后转发给后端服务器，后端服务器收到后，因为它不对Content-Length进行处理，由于Pipeline的存在，后端服务器就任务这是收到了两个请求，分别是:

第一个:

第二个:

所有造成了请求走私。

2.CL-CL

有些服务器不会严格的实现该规范，假设中间的代理服务器和后端的源站服务器在收到类似的请求时，都不会返回400错误。

但是中间代理服务器按照第一个Content-Length的值对请求进行处理，而后端源站按照第二个Cont-Length的值进行处理。

构造请求示例：

攻击流程:

中间代理服务器获取到的数据包的长度为8，将上述整个数据包原封不动的转发给后端源站服务器。

而后端服务器获取到的数据包长度为7。当读取完7个字符后，后端服务器认为已经读取完毕，然后生成对应的响应发送出去。而此时的缓冲区还剩余一个字母a，对于后端服务器来说，这个a是下一个请求的一部分，但是还没有传输完毕。

如果此时有一个其他的正常用户对服务器进行了请求:

因为代理服务器和源站服务器之间一般会重用TCP连接。所以正常用户的请求就拼接到字母a后面，当后端服务器接收完毕后，它实际处理的请求其实是:

这时，用户就会收到一个类似于aGET request method not found的报错。这样就实现了一次HTTP走私攻击，而且还对正常用户的行为造成了影响，而且还可以扩展成类似于CSRF的攻击方式。

但是一般的服务器都不会接受这种存在两个请求头的请求包。该怎么办？

所有想到前面所说的

RFC2616规范

如果收到同时存在Content-Length和Transfer-Encoding这两个请求头的请求包时，，在处理的时候必须忽略Content-Length。

所以请求包中同时包含这两个请求头并不算违规，服务器也不需要返回400错误。导致服务器在这里的实现更容易出问题。

3.CL-TE

CL-TE，就是当收到存在两个请求头的请求包时，前端代理服务器只处理Content-Length请求头，而后端服务器会遵守RFC2616的规定，忽略掉Content-Length，处理Transfer-Encoding请求头。

构造请求示例:

连续发送几次请求就可以获取响应。

攻击流程：

由于前端服务器处理Content-Length，所以这个请求对于它来说是一个完整的请求，请求体的长度为6，也就是

当请求包经过代理服务器转发给后端服务器时，后端服务器处理Transfer-Encoding，当它读取到

认为已经读取到结尾了。

但剩下的字母a就被留在了缓冲区中，等待下一次请求。当我们重复发送请求后，发送的请求在后端服务器拼接成了类似下面这种请求：

服务器在解析时就会产生报错了，从而造成HTTP请求走私。

4.TE-CL

TE-CL，就是当收到存在两个请求头的请求包时，前端代理服务器处理Transfer-Encoding请求头，后端服务器处理Content-Length请求头。

构造请求示例:

攻击流程：

前端服务器处理Transfer-Encoding，当其读取到

认为是读取完毕了。

此时这个请求对代理服务器来说是一个完整的请求，然后转发给后端服务器，后端服务器处理Content-Length请求头，因为请求体的长度为4.也就是当它读取完

就认为这个请求已经结束了。后面的数据就认为是另一个请求：

成功报错，造成HTTP请求走私。

5.TE-TE

TE-TE，当收到存在两个请求头的请求包时，前后端服务器都处理Transfer-Encoding请求头，确实是实现了RFC的标准。不过前后端服务器不是同一种。这就有了一种方法，我们可以对发送的请求包中的Transfer-Encoding进行某种混淆操作(如某个字符改变大小写)，从而使其中一个服务器不处理Transfer-Encoding请求头。在某种意义上这还是CL-TE或者TE-CL。

构造请求示例：

攻击流程：

前端服务器处理Transfer-Encoding，当其读取到

认为是读取结束。

此时这个请求对代理服务器来说是一个完整的请求，然后转发给后端服务器处理Transfer-encoding请求头，将Transfer-Encoding隐藏在服务端的一个chain中时，它将会回退到使用Content-Length去发送请求。读取到

认为是读取完毕了。后面的数据就认为是另一个请求：

成功报错，造成HTTP请求走私。

实战攻击

其它几种请求走私依旧可以，就不测试了。

可能用得到的几个函数

scandir() 函数返回指定目录中的文件和目录的数组。

base_convert() 函数在任意进制之间转换数字，返回一个字符串

dechex() 函数：把十进制转换为十六进制。

hex2bin() 函数：把十六进制值的字符串转换为 ASCII 字符。

readfile() 函数

输出一个文件。

该函数读入一个文件并写入到输出缓冲。若成功，则返回从文件中读入的字节数。若失败，则返回 false。您可以通过 @readfile() 形式调用该函数，来隐藏错误信息。

输入时发现num只能输入数字，输入字符无法解析。

这里可以利用php的字符串解析特性绕过bypass：利用PHP的字符串解析特性Bypass

PHP需要将所有参数转换为有效的变量名，因此在解析查询字符串时，它会做两件事：

1.删除空白符

2.将某些字符转换为下划线（包括空格）

我们首先要构造列目录的payload，肯定要使用scandir函数，尝试构造列举根目录下的文件。scandir可以用base_convert函数构造，但是利用base_convert只能解决a~z的利用，因为根目录需要/符号，且不在a~z,所以需要hex2bin(dechex(47))这种构造方式，dechex() 函数把十进制数转换为十六进制数。hex2bin() 函数把十六进制值的字符串转换为 ASCII 字符。

构造读取flag，使用readfile函数，paload：base_convert(2146934604002,10,36)(hex2bin(dechex(47)).base_convert(25254448,10,36))，方法类似

学习笔记

http走私攻击([RoarCTF 2019]Easy Calc)

http走私攻击介绍

HTTP请求走私攻击的5种方式

1.CL不为0

2.CL-CL

RFC2616规范

3.CL-TE

4.TE-CL

5.TE-TE

实战攻击