“手撕” Cobalt Strike">“手撕” Cobalt Strike

“手撕” Cobalt Strike

背景

众所周知，Cobalt Strike是一款在渗透测试活动当中，经常使用的C2（Command And Control/远程控制工具）。而Cobalt Strike的对抗是在攻防当中逃不开的话题，近几年来该领域对抗也愈发白热化。而绝大多数厂商的查杀，也是基于内存进行，然而其检测方式的不当，导致非常容易被Bypass，包括但不限于：

扫描RWX内存（正常进程中的Private Data区域一般没有执行权限）
DOS头
扫描特征
字符串特征
ReflectiveLoader
beacon.x64.dll
Beacon Config（使用前）
……

上面列出的这些方法，实际都能绕过，核心原因是，去掉这些特征可以不影响Cobalt Strike Beacon的正常运行

BeaconEye核心原理

近日有安全人员开源了一款检测Cobalt Strike Beacon的工具，名字叫BeaconEye，核心原理是通过扫描Cobalt Strike中的内存特征，并进行Beacon Config扫描解析出对应的Beacon信息。该项目的最大的特点是绕过难度较高（相比于其他同类型扫描工具），接下来对工具的核心原理进行剖析。

Beacon.dll

Cobalt Strike的shellcode，实际都是通过反射加载的方式加载Beacon.dll，而Beacon.dll中存在Beacon Config配置信息（主要定义通信目标/通信方式等），在Cobalt Strike中对应的Resource是sleeve/beacon.dll：

长亭 - "手撕" Cobalt Strike - 图1

Beacon Config Generate

Beacon Config的生成在BeaconPayload类的exportBeaconStage函数中：
长亭 - "手撕" Cobalt Strike - 图2

这上面指向的Settings结构体就是Beacon Config，比如var1，它代表实际通信的端口：长亭 - "手撕" Cobalt Strike - 图4
最终Cobalt Strike会将Settings转化为bytes数组，然后使用固定的密钥进行Xor,并对剩余空白字段填入随机字符：

长亭 - "手撕" Cobalt Strike - 图5

最后将生成的beacon.dll嵌入到最终的PE文件中：长亭 - "手撕" Cobalt Strike - 图6

Beacon Struct

Settings的Add系列函数，如AddShort，并不是简单的将Short类型直接追加到bytes数组中，而是追加了一个结构体：

长亭 - "手撕" Cobalt Strike - 图7

第一个字段是index，第二个是type（short/int/…），第三个是length，第四个则是关键的value值，因此根据这个结构即可解析在内存或在文件中的Beacon Config。

BeaconEye规则

BeaconEye的yara规则，32位的Beacon Config：**

长亭 - "手撕" Cobalt Strike - 图8
如果认真阅读了前文一定会觉得很疑惑，因为按照Java当中的结构，它应该分为四个部分：

[ ID ] [ DATA TYPE ID ] [ LENGTH OF VALUE ] [ VALUE ]

但是实际的yara规则却没有办法对上java中的Beacon Config结构，说明Beacon.dll在装载的过程中，并没有直接将上述数据memcpy分配到堆中，接下来让我们通过对beacon.dll进行逆向

长亭 - "手撕" Cobalt Strike - 图9
通过dllmain跟进，发现有一个关键函数，里面首先解密了先前Beacon Config的加密数据，然后遍历Beacon Config。首先是在拿到了Type之后，直接往堆中分配的内存写入WORD长度的Type，然后根据Type进行判断，case 1对应Short，case 2对应Int，case 3对应Data，所以实际上最终的Beacon Config的结构是：

DWORD DWORD[ DATA TYPE] [ VALUE ]

因此最终的yara规则可以解读如下：

长亭 - "手撕" Cobalt Strike - 图10
??代表通配符，实际匹配的就是beacon.dll当中真正的config结构体。

Bypass BeaconEye

而近日有安全人员提出在执行Cobalt Strike的Shellcode之前，通过调用SymInitialize即可实现Bypass。

SymInitialize作用

根据官方文档的描述，SymInitialize的作用是用来初始化进程符号句柄的：

长亭 - "手撕" Cobalt Strike - 图11
传参有三个

hProcess: 代表进程句柄
UserSearchPath: 符号文件的搜索路径
fInvadeProcess: 是否对进程中已加载的每个模块调用SymLoadModule64函数。

仅仅从传参来看，并没有办法明确的判定为什么能Bypass，因此我们使用windbg进行对比抓取。

Windbg调试

分别对调用了SymInitialize和没有调用SymInitialize的Cobalt Strike的Beacon进行windbg调试，由于我们知道BeaconEye扫描的是堆内存，因此我们直接对比两者的堆内存：

长亭 - "手撕" Cobalt Strike - 图12

长亭 - "手撕" Cobalt Strike - 图13
从上面两张图可以很清晰的看到，这两个进程在堆内存中的最大的区别是，使用了SymInitialize的第一个heap区域，比没有使用SymInitialize的第一个heap区域，多了几个Segment，那为什么多了几个Segment就导致BeaconEye无法扫描呢?

Windows中Heap结构

使用windbg，执行命令“dt !_heap”，查看一下具体Heap的结构：

长亭 - "手撕" Cobalt Strike - 图14
可以看到heap结构的字段非常的多，这里重点关心3个字段：

SegmentListEntry: 存储堆段地址的双向链表
BaseAddress: 堆段起始地址
NumberOfPages: 页面的数量

一个堆段的范围是怎么计算出来的呢？非常简单：

BaseAddress ~ BaseAddress + NumberOfPages * PageSize

而每一个BaseAddress以及NumberOfPages，都仅仅只针对当前的堆段。

NtQueryVirtualMemory

BeaconEye中查询内存信息实际调用的是NtQueryVirtualMemory，Nt系列函数是Windows中Ring3进入Ring0的入口，查看该函数的官方文档：长亭 - "手撕" Cobalt Strike - 图15

        可以看到查询的信息都存到了**MemoryInformation**中，而**MemoryInformation**对应的结构体是**MEMORY_INFORMATION_CLASS**，MEMORY_INFORMATION_CLASS实际包含了一个**MEMORY_BASIC_INFORMATION**，MEMORY_BASIC_INFORMATION结构如下：<br />![](https://cdn.nlark.com/yuque/0/2022/webp/1632223/1641354460487-24d256d3-c5ab-4941-b569-67ffa3cd4e04.webp#clientId=u59dfd807-0260-4&crop=0&crop=0&crop=1&crop=1&from=paste&id=u2dc8d415&margin=%5Bobject%20Object%5D&originHeight=476&originWidth=932&originalType=url&ratio=1&rotation=0&showTitle=false&status=done&style=none&taskId=uf2148d39-6198-4b56-93ef-4c512cc7a31&title=)

查看RegionSize的描述：
长亭 - "手撕" Cobalt Strike - 图16
翻译过来的意思是，RegionSize的计算方式是，从起始地址开始，直到内存页的属性不一致为止，包含的byte数量，就是RegionSize。

猜想与验证

初步得出结论，BeaconEye当中获取堆的信息时，实际只获取了第一个堆段（因为堆段和堆段之间是不连贯的，导致内存页属性不能保持一致），因此假设Beacon Config没有被释放在第一个堆段中，就会导致BeaconEye检测失败，为了实现这个猜想，将SymInitialize注释掉，转而手动调用HeapAlloc进行堆分配（当堆空间分配的足够多时，就会触发系统自动生成堆段），如果这个猜想是正确的，那么BeaconEye将同样无法扫描：

长亭 - "手撕" Cobalt Strike - 图17

编译运行，再使用BeaconEye进行检测，发现已经无法检测了，猜想bingo：
长亭 - "手撕" Cobalt Strike - 图18

BeaconEye修复（伪）

不能检测的原因已经找到了，修复其实非常简单，前面提到过，heap结构中包含了堆段的双向链表，因此只需要在BeaconEye当中，遍历这个双向链表，将所有堆段地址都添加到待扫描列表中即可，以下是修复代码：
长亭 - "手撕" Cobalt Strike - 图19

这个时候重新编译，扫描原先使用了SymInitialize的Cobalt Strike Beacon，发现已经可以扫出来了：
长亭 - "手撕" Cobalt Strike - 图20

为什么还是被Bypass了?

但是事情远远没有那么简单，因为我发现先前手动调用HeapAlloc的Cobalt Strike Beacon并没有扫出来，这令我百思不得其解，为了解决问题，我的思路是先确定Beacon Config在内存中哪个位置，这里同样使用yara进行确认（扫描完整内存），得到具体的位置后，调试BeaconEye并判断是否读取到了对应的内存。经过一番调试，发现BeaconEye确实存在于堆段中，但是BeaconEye并没有完整的读取到堆段的所有内存，示意图如下：
长亭 - "手撕" Cobalt Strike - 图21

红色部分是BeaconEye实际读取到的内存，绿色部分是实际Beacon Config存放的位置，为什么会出现这种情况，这个时候就得继续回到Windows的内存设计上。

HeapBlock

在Windows的堆内存当中，除了堆段以外，还有一个概念叫堆块，每一个堆段都是由多个堆块组成的，使用vmmap工具即可查看：
长亭 - "手撕" Cobalt Strike - 图22

不难发现每一个堆段包含了大量的堆块，这也解释了为什么BeaconEye会检测失效，因为堆块和堆块之间存在属性不一致的内存页，导致只能读取部分内存空间。
而在实际的进程当中，堆块对应的结构体是_HEAP_ENTRY：
长亭 - "手撕" Cobalt Strike - 图23

但是在_HEAP_SEGMENT当中，只有FirstEntry和LastValidEntry，这两个字段的含义是指向第一个以及最后一个堆块：
长亭 - "手撕" Cobalt Strike - 图24
而经过阅读相关资料，发现并没有链表将所有堆块串联起来（无论堆块是何种状态），因此堆块的位置需要手动计算，这里存在一个小插曲，就是windows实际是加密了_HEAP_ENTRY这个结构的，加密方式是Xor，而Xor的密钥则在_HEAP结构的0x88（x86是0x50），因此在计算堆块大小时，需要手动解密Size。

BeaconEye修复（真）

在之前的修复代码上，手动计算所有堆块的地址，并添加到待扫描列表当中，代码如下（方便演示这里只写了x64部分）：
长亭 - "手撕" Cobalt Strike - 图25

编译修复的BeaconEye，重新扫描手动调用了HeapAlloc去Bypass原版BeaconEye的Beacon，发现已经可以扫描了：

长亭 - "手撕" Cobalt Strike - 图26

结语

目前这个加强修复版的代码，可以通杀Cobalt Strike全版本（3.x的yara规则需要修改），这对攻击方来说提出了更高的挑战以及要求。目前该检测功能已经集成到即将发布的牧云新版本当中，也欢迎大家来申请试用体验更强大的主机安全产品。
另外，牧云团队正在招聘主机安全领域的产品安全研究员，如果你和我一样，喜欢研究红蓝对抗，并希望将它落地到产品当中，欢迎投递简历，投递邮箱为jingyuan.chen@chaitin.com