目录

通用安全指南

1 C/C++使用错误

1.1 【必须】不得直接使用无长度限制的字符拷贝函数

不应直接使用legacy的字符串拷贝、输入函数,如strcpy、strcat、sprintf、wcscpy、mbscpy等,这些函数的特征是:可以输出一长串字符串,而不限制长度。如果环境允许,应当使用其_s安全版本替代,或者使用n版本函数(如:snprintf,vsnprintf)。
若使用形如sscanf之类的函数时,在处理字符串输入时应当通过%10s这样的方式来严格限制字符串长度,同时确保字符串末尾有\0。如果环境允许,应当使用_s安全版本。
但是注意,虽然MSVC 2015时默认引入结尾为0版本的snprintf(行为等同于C99定义的snprintf)。但更早期的版本中,MSVC的snprintf可能是_snprintf的宏。而_snprintf是不保证\0结尾的(见本节后半部分)。

  1. MSVC
  2. Beginning with the UCRT in Visual Studio 2015 and Windows 10, snprintf is no longer identical to _snprintf. The snprintf function behavior is now C99 standard compliant.
  3. Visual Studio 2015Windows 10中的UCRT开始,snprintf不再与_snprintf相同。snprintf函数行为现在符合C99标准。
  4. 请参考:https://docs.microsoft.com/en-us/cpp/c-runtime-library/reference/snprintf-snprintf-snprintf-l-snwprintf-snwprintf-l?redirectedfrom=MSDN&view=vs-2019

因此,在使用n系列拷贝函数时,要确保正确计算缓冲区长度,同时,如果你不确定是否代码在各个编译器下都能确保末尾有0时,建议可以适当增加1字节输入缓冲区,并将其置为\0,以保证输出的字符串结尾一定有\0。

  1. // Good
  2. char buf[101] = {0};
  3. snprintf(buf, sizeof(buf) - 1, "foobar ...", ...);

一些需要注意的函数,例如strncpy_snprintf是不安全的。 strncpy不应当被视为strcpy的n系列函数,它只是恰巧与其他n系列函数名字很像而已。strncpy在复制时,如果复制的长度超过n,不会在结尾补\0。
同样,MSVC _snprintf系列函数在超过或等于n时也不会以0结尾。如果后续使用非0结尾的字符串,可能泄露相邻的内容或者导致程序崩溃。

  1. // Bad
  2. char a[4] = {0};
  3. _snprintf(a, 4, "%s", "AAAA");
  4. foo = strlen(a);

上述代码在MSVC中执行后, a[4] == ‘A’,因此字符串未以0结尾。a的内容是”AAAA”,调用strlen(a)则会越界访问。因此,正确的操作举例如下:

  1. // Good
  2. char a[4] = {0};
  3. _snprintf(a, sizeof(a), "%s", "AAAA");
  4. a[sizeof(a) - 1] = '\0';
  5. foo = strlen(a);

在 C++ 中,强烈建议用 stringvector 等更高封装层次的基础组件代替原始指针和动态数组,对提高代码的可读性和安全性都有很大的帮助。
关联漏洞:
中风险-信息泄露
低风险-拒绝服务
高风险-缓冲区溢出

1.2 【必须】创建进程类的函数的安全规范

system、WinExec、CreateProcess、ShellExecute等启动进程类的函数,需要严格检查其参数。
启动进程需要加上双引号,错误例子:

  1. // Bad
  2. WinExec("D:\\program files\\my folder\\foobar.exe", SW_SHOW);

当存在D:\program files\my.exe的时候,my.exe会被启动。而foobar.exe不会启动。

  1. // Good
  2. WinExec("\"D:\\program files\\my folder\\foobar.exe\"", SW_SHOW);

另外,如果启动时从用户输入、环境变量读取组合命令行时,还需要注意是否可能存在命令注入。

  1. // Bad
  2. std::string cmdline = "calc ";
  3. cmdline += user_input;
  4. system(cmdline.c_str());

比如,当用户输入1+1 && ls时,执行的实际上是calc 1+1和ls 两个命令,导致命令注入。
需要检查用户输入是否含有非法数据。

  1. // Good
  2. std::string cmdline = "ls ";
  3. cmdline += user_input;
  4. if(cmdline.find_first_not_of("1234567890.+-*/e ") == std::string::npos)
  5. system(cmdline.c_str());
  6. else
  7. warning(...);

关联漏洞:
高风险-代码执行
高风险-权限提升

1.3 【必须】尽量减少使用 _alloca 和可变长度数组

_alloca 和可变长度数组使用的内存量在编译期间不可知。尤其是在循环中使用时,根据编译器的实现不同,可能会导致:(1)栈溢出,即拒绝服务; (2)缺少栈内存测试的编译器实现可能导致申请到非栈内存,并导致内存损坏。这在栈比较小的程序上,例如IoT设备固件上影响尤为大。对于 C++,可变长度数组也属于非标准扩展,在代码规范中禁止使用。
错误示例:

  1. // Bad
  2. for (int i = 0; i < 100000; i++) {
  3. char* foo = (char *)_alloca(0x10000);
  4. ..do something with foo ..;
  5. }
  6. void Foo(int size) {
  7. char msg[size]; // 不可控的栈溢出风险!
  8. }

正确示例:

  1. // Good
  2. // 改用动态分配的堆内存
  3. for (int i = 0; i < 100000; i++) {
  4. char * foo = (char *)malloc(0x10000);
  5. ..do something with foo ..;
  6. if (foo_is_no_longer_needed) {
  7. free(foo);
  8. foo = NULL;
  9. }
  10. }
  11. void Foo(int size) {
  12. std::string msg(size, '\0'); // C++
  13. char* msg = malloc(size); // C
  14. }

关联漏洞:
低风险-拒绝服务
高风险-内存破坏

1.4 【必须】printf系列参数必须对应

所有printf系列函数,如sprintf,snprintf,vprintf等必须对应控制符号和参数。
错误示例:

  1. // Bad
  2. const int buf_size = 1000;
  3. char buffer_send_to_remote_client[buf_size] = {0};
  4. snprintf(buffer_send_to_remote_client, buf_size, "%d: %p", id, some_string); // %p 应为 %s
  5. buffer_send_to_remote_client[buf_size - 1] = '\0';
  6. send_to_remote(buffer_send_to_remote_client);

正确示例:

  1. // Good
  2. const int buf_size = 1000;
  3. char buffer_send_to_remote_client[buf_size] = {0};
  4. snprintf(buffer_send_to_remote_client, buf_size, "%d: %s", id, some_string);
  5. buffer_send_to_remote_client[buf_size - 1] = '\0';
  6. send_to_remote(buffer_send_to_remote_client);

前者可能会让client的攻击者获取部分服务器的原始指针地址,可以用于破坏ASLR保护。
关联漏洞:
中风险-信息泄露

1.5 【必须】防止泄露指针(包括%p)的值

所有printf系列函数,要防止格式化完的字符串泄露程序布局信息。例如,如果将带有%p的字符串泄露给程序,则可能会破坏ASLR的防护效果。使得攻击者更容易攻破程序。
%p的值只应当在程序内使用,而不应当输出到外部或被外部以某种方式获取。
错误示例:

  1. // Bad
  2. // 如果这是暴露给客户的一个API:
  3. uint64_t GetUniqueObjectId(const Foo* pobject) {
  4. return (uint64_t)pobject;
  5. }

正确示例:

  1. // Good
  2. uint64_t g_object_id = 0;
  3. void Foo::Foo() {
  4. this->object_id_ = g_object_id++;
  5. }
  6. // 如果这是暴露给客户的一个API:
  7. uint64_t GetUniqueObjectId(const Foo* object) {
  8. if (object)
  9. return object->object_id_;
  10. else
  11. error(...);
  12. }

关联漏洞:
中风险-信息泄露

1.6 【必须】不应当把用户可修改的字符串作为printf系列函数的“format”参数

如果用户可以控制字符串,则通过 %n %p 等内容,最坏情况下可以直接执行任意恶意代码。
在以下情况尤其需要注意: WIFI名,设备名……
错误:

  1. snprintf(buf, sizeof(buf), wifi_name);

正确:

  1. snprinf(buf, sizeof(buf), "%s", wifi_name);

关联漏洞:
高风险-代码执行
高风险-内存破坏
中风险-信息泄露
低风险-拒绝服务

1.7 【必须】对数组delete时需要使用delete[]

delete []操作符用于删除数组。delete操作符用于删除非数组对象。它们分别调用operator delete[]和operator delete。

  1. // Bad
  2. Foo* b = new Foo[5];
  3. delete b; // trigger assert in DEBUG mode

在new[]返回的指针上调用delete将是取决于编译器的未定义行为。代码中存在对未定义行为的依赖是错误的。

  1. // Good
  2. Foo* b = new Foo[5];
  3. delete[] b;

在 C++ 代码中,使用 stringvector、智能指针(比如std::unique_ptr)等可以消除绝大多数 delete[] 的使用场景,并且代码更清晰。
关联漏洞:
高风险-内存破坏
中风险-逻辑漏洞
低风险-内存泄漏
低风险-拒绝服务

1.8【必须】注意隐式符号转换

两个无符号数相减为负数时,结果应当为一个很大的无符号数,但是小于int的无符号数在运算时可能会有预期外的隐式符号转换。

  1. // 1
  2. unsigned char a = 1;
  3. unsigned char b = 2;
  4. if (a - b < 0) // a - b = -1 (signed int)
  5. a = 6;
  6. else
  7. a = 8;
  8. // 2
  9. unsigned char a = 1;
  10. unsigned short b = 2;
  11. if (a - b < 0) // a - b = -1 (signed int)
  12. a = 6;
  13. else
  14. a = 8;

上述结果均为a=6

  1. // 3
  2. unsigned int a = 1;
  3. unsigned short b = 2;
  4. if (a - b < 0) // a - b = 0xffffffff (unsigned int)
  5. a = 6;
  6. else
  7. a = 8;
  8. // 4
  9. unsigned int a = 1;
  10. unsigned int b = 2;
  11. if (a - b < 0) // a - b = 0xffffffff (unsigned int)
  12. a = 6;
  13. else
  14. a = 8;

上述结果均为a=8
如果预期为8,则错误代码:

  1. // Bad
  2. unsigned short a = 1;
  3. unsigned short b = 2;
  4. if (a - b < 0) // a - b = -1 (signed int)
  5. a = 6;
  6. else
  7. a = 8;

正确代码:

  1. // Good
  2. unsigned short a = 1;
  3. unsigned short b = 2;
  4. if ((unsigned int)a - (unsigned int)b < 0) // a - b = 0xffff (unsigned short)
  5. a = 6;
  6. else
  7. a = 8;

关联漏洞:
中风险-逻辑漏洞

1.9【必须】注意八进制问题

代码对齐时应当使用空格或者编辑器自带的对齐功能,谨慎在数字前使用0来对齐代码,以免不当将某些内容转换为八进制。
例如,如果预期为20字节长度的缓冲区,则下列代码存在错误。buf2为020(OCT)长度,实际只有16(DEC)长度,在memcpy后越界:

  1. // Bad
  2. char buf1[1024] = {0};
  3. char buf2[0020] = {0};
  4. memcpy(buf2, somebuf, 19);

应当在使用8进制时明确注明这是八进制。

  1. // Good
  2. int access_mask = 0777; // oct, rwxrwxrwx

关联漏洞:
中风险-逻辑漏洞

2 不推荐的编程习惯

2.1 【必须】switch中应有default

switch中应该有default,以处理各种预期外的情况。这可以确保switch接受用户输入,或者后期在其他开发者修改函数后确保switch仍可以覆盖到所有情况,并确保逻辑正常运行。

  1. // Bad
  2. int Foo(int bar) {
  3. switch (bar & 7) {
  4. case 0:
  5. return Foobar(bar);
  6. break;
  7. case 1:
  8. return Foobar(bar * 2);
  9. break;
  10. }
  11. }

例如上述代码switch的取值可能从0~7,所以应当有default:

  1. // Good
  2. int Foo(int bar) {
  3. switch (bar & 7) {
  4. case 0:
  5. return Foobar(bar);
  6. break;
  7. case 1:
  8. return Foobar(bar * 2);
  9. break;
  10. default:
  11. return -1;
  12. }
  13. }

关联漏洞:
中风险-逻辑漏洞
中风险-内存泄漏

2.2 【必须】不应当在Debug或错误信息中提供过多内容

包含过多信息的Debug消息不应当被用户获取到。Debug信息可能会泄露一些值,例如内存数据、内存地址等内容,这些内容可以帮助攻击者在初步控制程序后,更容易地攻击程序。

  1. // Bad
  2. int Foo(int* bar) {
  3. if (bar && *bar == 5) {
  4. OutputDebugInfoToUser("Wrong value for bar %p = %d\n", bar, *bar);
  5. }
  6. }

而应该:

  1. // Good
  2. int foo(int* bar) {
  3. #ifdef DEBUG
  4. if (bar && *bar == 5) {
  5. OutputDebugInfo("Wrong value for bar.\n", bar, *bar);
  6. }
  7. #endif
  8. }

关联漏洞:
中风险-信息泄漏

2.3 【必须】不应该在客户端代码中硬编码对称加密秘钥

不应该在客户端代码中硬编码对称加密秘钥。例如:不应在客户端代码使用硬编码的 AES/ChaCha20-Poly1305/SM1 密钥,使用固定密钥的程序基本和没有加密一样。
如果业务需求是认证加密数据传输,应优先考虑直接用 HTTPS 协议。
如果是其它业务需求,可考虑由服务器端生成对称秘钥,客户端通过 HTTPS 等认证加密通信渠道从服务器拉取。
或者根据用户特定的会话信息,比如登录认证过程可以根据用户名用户密码业务上下文等信息,使用 HKDF 等算法衍生出对称秘钥。
又或者使用 RSA/ECDSA + ECDHE 等进行认证秘钥协商,生成对称秘钥。

  1. // Bad
  2. char g_aes_key[] = {...};
  3. void Foo() {
  4. ....
  5. AES_func(g_aes_key, input_data, output_data);
  6. }

可以考虑在线为每个用户获取不同的密钥:

  1. // Good
  2. char* g_aes_key;
  3. void Foo() {
  4. ....
  5. AES_encrypt(g_aes_key, input_data, output_data);
  6. }
  7. void Init() {
  8. g_aes_key = get_key_from_https(user_id, ...);
  9. }

关联漏洞:
中风险-信息泄露

2.4 【必须】返回栈上变量的地址

函数不可以返回栈上的变量的地址,其内容在函数返回后就会失效。

  1. // Bad
  2. char* Foo(char* sz, int len){
  3. char a[300] = {0};
  4. if (len > 100) {
  5. memcpy(a, sz, 100);
  6. }
  7. a[len] = '\0';
  8. return a; // WRONG
  9. }

而应当使用堆来传递非简单类型变量。

  1. // Good
  2. char* Foo(char* sz, int len) {
  3. char* a = new char[300];
  4. if (len > 100) {
  5. memcpy(a, sz, 100);
  6. }
  7. a[len] = '\0';
  8. return a; // OK
  9. }

对于 C++ 程序来说,强烈建议返回 stringvector 等类型,会让代码更加简单和安全。
关联漏洞:
高风险-内存破坏

2.5 【必须】有逻辑联系的数组必须仔细检查

例如下列程序将字符串转换为week day,但是两个数组并不一样长,导致程序可能会越界读一个int。

  1. // Bad
  2. int nWeekdays[] = {1, 2, 3, 4, 5, 6};
  3. const char* sWeekdays[] = {"Mon", "Tue", "Wed", "Thu", "Fri", "Sat", "Sun"};
  4. for (int x = 0; x < ARRAY_SIZE(sWeekdays); x++) {
  5. if (strcmp(sWeekdays[x], input) == 0)
  6. return nWeekdays[x];
  7. }

应当确保有关联的nWeekdays和sWeekdays数据统一。

  1. // Good
  2. const int nWeekdays[] = {1, 2, 3, 4, 5, 6, 7};
  3. const char* sWeekdays[] = {"Mon", "Tue", "Wed", "Thu", "Fri", "Sat", "Sun"};
  4. assert(ARRAY_SIZE(nWeekdays) == ARRAY_SIZE(sWeekdays));
  5. for (int x = 0; x < ARRAY_SIZE(sWeekdays); x++) {
  6. if (strcmp(sWeekdays[x], input) == 0) {
  7. return nWeekdays[x];
  8. }
  9. }

关联漏洞:
高风险-内存破坏

2.6 【必须】避免函数的声明和实现不同

在头文件、源代码、文档中列举的函数声明应当一致,不应当出现定义内容错位的情况。
错误:
foo.h

  1. int CalcArea(int width, int height);

foo.cc

  1. int CalcArea(int height, int width) { // Different from foo.h
  2. if (height > real_height) {
  3. return 0;
  4. }
  5. return height * width;
  6. }

正确:
foo.h

  1. int CalcArea(int height, int width);

foo.cc

  1. int CalcArea (int height, int width) {
  2. if (height > real_height) {
  3. return 0;
  4. }
  5. return height * width;
  6. }

关联漏洞:
中风险-逻辑问题

2.7 【必须】检查复制粘贴的重复代码(相同代码通常代表错误)

当开发中遇到较长的句子时,如果你选择了复制粘贴语句,请记得检查每一行代码,不要出现上下两句一模一样的情况,这通常代表代码哪里出现了错误:

  1. // Bad
  2. void Foobar(SomeStruct& foobase, SomeStruct& foo1, SomeStruct& foo2) {
  3. foo1.bar = (foo1.bar & 0xffff) | (foobase.base & 0xffff0000);
  4. foo1.bar = (foo1.bar & 0xffff) | (foobase.base & 0xffff0000);
  5. }

如上例,通常可能是:

  1. // Good
  2. void Foobar(SomeStruct& foobase, SomeStruct& foo1, SomeStruct& foo2) {
  3. foo1.bar = (foo1.bar & 0xffff) | (foobase.base & 0xffff0000);
  4. foo2.bar = (foo2.bar & 0xffff) | (foobase.base & 0xffff0000);
  5. }

最好是把重复的代码片段提取成函数,如果函数比较短,可以考虑定义为 inline 函数,在减少冗余的同时也能确保不会影响性能。
关联漏洞:
中风险-逻辑问题

2.8 【必须】左右一致的重复判断/永远为真或假的判断(通常代表错误)

这通常是由于自动完成或例如Visual Assistant X之类的补全插件导致的问题。

  1. // Bad
  2. if (foo1.bar == foo1.bar) {
  3. }

可能是:

  1. // Good
  2. if (foo1.bar == foo2.bar) {
  3. }

关联漏洞:
中风险-逻辑问题

2.9 【必须】函数每个分支都应有返回值

函数的每个分支都应该有返回值,否则如果函数走到无返回值的分支,其结果是未知的。

  1. // Bad
  2. int Foo(int bar) {
  3. if (bar > 100) {
  4. return 10;
  5. } else if (bar > 10) {
  6. return 1;
  7. }
  8. }

上述例子当bar<10时,其结果是未知的值。

  1. // Good
  2. int Foo(int bar) {
  3. if (bar > 100) {
  4. return 10;
  5. } else if (bar > 10) {
  6. return 1;
  7. }
  8. return 0;
  9. }

开启适当级别的警告(GCC 中为 -Wreturn-type 并已包含在 -Wall 中)并设置为错误,可以在编译阶段发现这类错误。
关联漏洞:
中风险-逻辑问题
中风险-信息泄漏

2.10 【必须】不得使用栈上未初始化的变量

在栈上声明的变量要注意是否在使用它之前已经初始化了

  1. // Bad
  2. void Foo() {
  3. int foo;
  4. if (Bar()) {
  5. foo = 1;
  6. }
  7. Foobar(foo); // foo可能没有初始化
  8. }

最好在声明的时候就立刻初始化变量,或者确保每个分支都初始化它。开启相应的编译器警告(GCC 中为 -Wuninitialized),并把设置为错误级别,可以在编译阶段发现这类错误。

  1. // Good
  2. void Foo() {
  3. int foo = 0;
  4. if (Bar()) {
  5. foo = 1;
  6. }
  7. Foobar(foo);
  8. }

关联漏洞:
中风险-逻辑问题
中风险-信息泄漏

2.11 【建议】不得直接使用刚分配的未初始化的内存(如realloc)

一些刚申请的内存通常是直接从堆上分配的,可能包含有旧数据的,直接使用它们而不初始化,可能会导致安全问题。例如,CVE-2019-13751。应确保初始化变量,或者确保未初始化的值不会泄露给用户。

  1. // Bad
  2. char* Foo() {
  3. char* a = new char[100];
  4. a[99] = '\0';
  5. memcpy(a, "char", 4);
  6. return a;
  7. }
  1. // Good
  2. char* Foo() {
  3. char* a = new char[100];
  4. memcpy(a, "char", 4);
  5. a[4] = '\0';
  6. return a;
  7. }

在 C++ 中,再次强烈推荐用 stringvector 代替手动内存分配。
关联漏洞:
中风险-逻辑问题
中风险-信息泄漏

2.12 【必须】校验内存相关函数的返回值

与内存分配相关的函数需要检查其返回值是否正确,以防导致程序崩溃或逻辑错误。

  1. // Bad
  2. void Foo() {
  3. char* bar = mmap(0, 0x800000, .....);
  4. *(bar + 0x400000) = '\x88'; // Wrong
  5. }

如上例mmap如果失败,bar的值将是0xffffffff (ffffffff),第二行将会往0x3ffffff写入字符,导致越界写。

  1. // Good
  2. void Foo() {
  3. char* bar = mmap(0, 0x800000, .....);
  4. if(bar == MAP_FAILED) {
  5. return;
  6. }
  7. *(bar + 0x400000) = '\x88';
  8. }

关联漏洞:
中风险-逻辑问题
高风险-越界操作

2.13 【必须】不要在if里面赋值

if里赋值通常代表代码存在错误。

  1. // Bad
  2. void Foo() {
  3. if (bar = 0x99) ...
  4. }

通常应该是:

  1. // Good
  2. void Foo() {
  3. if (bar == 0x99) ...
  4. }

建议在构建系统中开启足够的编译器警告(GCC 中为 -Wparentheses 并已包含在 -Wall 中),并把该警告设置为错误。
关联漏洞:
中风险-逻辑问题

2.14 【建议】确认if里面的按位操作

if里,非bool类型和非bool类型的按位操作可能代表代码存在错误。

  1. // Bad
  2. void Foo() {
  3. int bar = 0x1; // binary 01
  4. int foobar = 0x2; // binary 10
  5. if (foobar & bar) // result = 00, false
  6. ...
  7. }

上述代码可能应该是:

  1. // Good
  2. void foo() {
  3. int bar = 0x1;
  4. int foobar = 0x2;
  5. if (foobar && bar) // result : true
  6. ...
  7. }

关联漏洞:
中风险-逻辑问题

3 多线程

3.1 【必须】变量应确保线程安全性

当一个变量可能被多个线程使用时,应当使用原子操作或加锁操作。

  1. // Bad
  2. char g_somechar;
  3. void foo_thread1() {
  4. g_somechar += 3;
  5. }
  6. void foo_thread2() {
  7. g_somechar += 1;
  8. }

对于可以使用原子操作的,应当使用一些可以确保内存安全的操作,如:

  1. // Good
  2. volatile char g_somechar;
  3. void foo_thread1() {
  4. __sync_fetch_and_add(&g_somechar, 3);
  5. }
  6. void foo_thread2() {
  7. __sync_fetch_and_add(&g_somechar, 1);
  8. }

对于 C 代码,C11 后推荐使用 atomic 标准库。
对于 C++代码,C++11 后,推荐使用 std::atomic
关联漏洞:
高风险-内存破坏
中风险-逻辑问题

3.2 【必须】注意signal handler导致的条件竞争

竞争条件经常出现在信号处理程序中,因为信号处理程序支持异步操作。攻击者能够利用信号处理程序争用条件导致软件状态损坏,从而可能导致拒绝服务甚至代码执行。

  1. 当信号处理程序中发生不可重入函数或状态敏感操作时,就会出现这些问题。因为信号处理程序中随时可以被调用。比如,当在信号处理程序中调用free时,通常会出现另一个信号争用条件,从而导致双重释放。即使给定指针在释放后设置为NULL,在释放内存和将指针设置为NULL之间仍然存在竞争的可能。
  2. 为多个信号设置了相同的信号处理程序,这尤其有问题——因为这意味着信号处理程序本身可能会重新进入。例如,malloc()和free()是不可重入的,因为它们可能使用全局或静态数据结构来管理内存,并且它们被syslog()等看似无害的函数间接使用;这些函数可能会导致内存损坏和代码执行。

    1. // Bad
    2. char *log_message;
    3. void Handler(int signum) {
    4. syslog(LOG_NOTICE, "%s\n", log_m_essage);
    5. free(log_message);
    6. sleep(10);
    7. exit(0);
    8. }
    9. int main (int argc, char* argv[]) {
    10. log_message = strdup(argv[1]);
    11. signal(SIGHUP, Handler);
    12. signal(SIGTERM, Handler);
    13. sleep(10);
    14. }

    可以借由下列操作规避问题:

  3. 避免在多个处理函数中共享某些变量。

  4. 在信号处理程序中使用同步操作。
  5. 屏蔽不相关的信号,从而提供原子性。
  6. 避免在信号处理函数中调用不满足异步信号安全的函数。

关联漏洞:
高风险-内存破坏
中风险-逻辑问题

3.3 【建议】注意Time-of-check Time-of-use (TOCTOU) 条件竞争

TOCTOU: 软件在使用某个资源之前检查该资源的状态,但是该资源的状态可以在检查和使用之间更改,从而使检查结果无效。当资源处于这种意外状态时,这可能会导致软件执行错误操作。
当攻击者可以影响检查和使用之间的资源状态时,此问题可能与安全相关。这可能发生在共享资源(如文件、内存,甚至多线程程序中的变量)上。在编程时需要注意避免出现TOCTOU问题。
例如,下面的例子中,该文件可能已经在检查和lstat之间进行了更新,特别是因为printf有延迟。

  1. struct stat *st;
  2. lstat("...", st);
  3. printf("foo");
  4. if (st->st_mtimespec == ...) {
  5. printf("Now updating things\n");
  6. UpdateThings();
  7. }

TOCTOU难以修复,但是有以下缓解方案:

  1. 限制对来自多个进程的文件的交叉操作。
  2. 如果必须在多个进程或线程之间共享对资源的访问,那么请尝试限制”检查“(CHECK)和”使用“(USE)资源之间的时间量,使他们相距尽量不要太远。这不会从根本上解决问题,但可能会使攻击更难成功。
  3. 在Use调用之后重新检查资源,以验证是否正确执行了操作。
  4. 确保一些环境锁定机制能够被用来有效保护资源。但要确保锁定是检查之前进行的,而不是在检查之后进行的,以便检查时的资源与使用时的资源相同。

关联漏洞:
高风险-内存破坏
中风险-逻辑问题

4 加密解密

4.1 【必须】不得明文存储用户密码等敏感数据

用户密码应该使用 Argon2, scrypt, bcrypt, pbkdf2 等算法做哈希之后再存入存储系统, https://password-hashing.net/
https://libsodium.gitbook.io/doc/password_hashing/default_phf#example-2-password-storage
用户敏感数据,应该做到传输过程中加密,存储状态下加密
传输过程中加密,可以使用 HTTPS 等认证加密通信协议
存储状态下加密,可以使用 SQLCipher 等类似方案。

4.2 【必须】内存中的用户密码等敏感数据应该安全抹除

例如用户密码等,即使是临时使用,也应在使用完成后应当将内容彻底清空。
错误:

  1. #include <openssl/crypto.h>
  2. #include <unistd.h>
  3. {
  4. ...
  5. string user_password(100, '\0');
  6. snprintf(&user_password, "password: %s", user_password.size(), password_from_input);
  7. ...
  8. }

正确:

  1. {
  2. ...
  3. string user_password(100, '\0');
  4. snprintf(&user_password, "password: %s", user_password.size(), password_from_input);
  5. ...
  6. OPENSSL_cleanse(&user_password[0], user_password.size());
  7. }

关联漏洞:
高风险-敏感信息泄露

4.3 【必须】rand() 类函数应正确初始化

rand类函数的随机性并不高。而且在使用前需要使用srand()来初始化。未初始化的随机数可能导致某些内容可预测。

  1. // Bad
  2. int main() {
  3. int foo = rand();
  4. return 0;
  5. }

上述代码执行完成后,foo的值是固定的。它等效于 srand(1); rand();

  1. // Good
  2. int main() {
  3. srand(time(0));
  4. int foo = rand();
  5. return 0;
  6. }

关联漏洞:
高风险-逻辑漏洞

4.4 【必须】在需要高强度安全加密时不应使用弱PRNG函数

在需要生成 AES/SM1/HMAC 等算法的密钥/IV/Nonce, RSA/ECDSA/ECDH 等算法的私钥,这类需要高安全性的业务场景,必须使用密码学安全的随机数生成器 (Cryptographically Secure PseudoRandom Number Generator (CSPRNG) ), 不得使用 rand() 等无密码学安全性保证的普通随机数生成器。
推荐使用的 CSPRNG 有:

  1. OpenSSL 中的 RAND_bytes() 函数, https://www.openssl.org/docs/man1.1.1/man3/RAND_bytes.html
  2. libsodium 中的 randombytes_buf() 函数
  3. Linux kernel 的 getrandom() 系统调用, https://man7.org/linux/man-pages/man2/getrandom.2.html .
    或者读 /dev/urandom 文件, 或者 /dev/random 文件。
  4. Apple IOS 的 SecRandomCopyBytes(), https://developer.apple.com/documentation/security/1399291-secrandomcopybytes
  5. Windows 下的 BCryptGenRandom(), CryptGenRandom(), RtlGenRandom()
    1. #include <openssl/aes.h>
    2. #include <openssl/crypto.h>
    3. #include <openssl/rand.h>
    4. #include <unistd.h>
    5. {
    6. unsigned char key[16];
    7. if (1 != RAND_bytes(&key[0], sizeof(key))) { //... 错误处理
    8. return -1;
    9. }
    10. AES_KEY aes_key;
    11. if (0 != AES_set_encrypt_key(&key[0], sizeof(key) * 8, &aes_key)) {
    12. // ... 错误处理
    13. return -1;
    14. }
    15. ...
    16. OPENSSL_cleanse(&key[0], sizeof(key));
    17. }
    rand()类函数的随机性并不高。敏感操作时,如设计加密算法时,不得使用rand()或者类似的简单线性同余伪随机数生成器来作为随机数发生器。符合该定义的比特序列的特点是,序列中“1”的数量约等于“0”的数量;同理,“01”、“00”、“10”、“11”的数量大致相同,以此类推。
    例如 C 标准库中的 rand() 的实现只是简单的线性同余算法,生成的伪随机数具有较强的可预测性。
    当需要实现高强度加密,例如涉及通信安全时,不应当使用 rand() 作为随机数发生器。
    实际应用中, C11 标准提供的random_device保证加密的安全性和随机性
    但是 C 标准并不保证这一点。跨平台的代码可以考虑用 OpenSSL 等保证密码学安全的库里的随机数发生器。
    关联漏洞:
    高风险-敏感数据泄露

    4.5 【必须】自己实现的rand范围不应过小

    如果在弱安全场景相关的算法中自己实现了PRNG,请确保rand出来的随机数不会很小或可预测。
    1. // Bad
    2. int32_t val = ((state[0] * 1103515245U) + 12345U) & 999999;
    上述例子可能想生成0~999999共100万种可能的随机数,但是999999的二进制是11110100001000111111,与&运算后,0位一直是0,所以生成出的范围明显会小于100万种。
    1. // Good
    2. int32_t val = ((state[0] * 1103515245U) + 12345U) % 1000000;
    3. // Good
    4. int32_t val = ((state[0] * 1103515245U) + 12345U) & 0x7fffffff;
    关联漏洞:
    高风险-逻辑漏洞

    5 文件操作

5.1 【必须】避免路径穿越问题

在进行文件操作时,需要判断外部传入的文件名是否合法,如果文件名中包含 ../ 等特殊字符,则会造成路径穿越,导致任意文件的读写。
错误:

  1. void Foo() {
  2. char file_path[PATH_MAX] = "/home/user/code/";
  3. // 如果传入的文件名包含../可导致路径穿越
  4. // 例如"../file.txt",则可以读取到上层目录的file.txt文件
  5. char name[20] = "../file.txt";
  6. memcpy(file_path + strlen(file_path), name, sizeof(name));
  7. int fd = open(file_path, O_RDONLY);
  8. if (fd != -1) {
  9. char data[100] = {0};
  10. int num = 0;
  11. memset(data, 0, sizeof(data));
  12. num = read(fd, data, sizeof(data));
  13. if (num > 0) {
  14. write(STDOUT_FILENO, data, num);
  15. }
  16. close(fd);
  17. }
  18. }

正确:

  1. void Foo() {
  2. char file_path[PATH_MAX] = "/home/user/code/";
  3. char name[20] = "../file.txt";
  4. // 判断传入的文件名是否非法,例如"../file.txt"中包含非法字符../,直接返回
  5. if (strstr(name, "..") != NULL){
  6. // 包含非法字符
  7. return;
  8. }
  9. memcpy(file_path + strlen(file_path), name, sizeof(name));
  10. int fd = open(file_path, O_RDONLY);
  11. if (fd != -1) {
  12. char data[100] = {0};
  13. int num = 0;
  14. memset(data, 0, sizeof(data));
  15. num = read(fd, data, sizeof(data));
  16. if (num > 0) {
  17. write(STDOUT_FILENO, data, num);
  18. }
  19. close(fd);
  20. }
  21. }

关联漏洞:
高风险-逻辑漏洞

5.2 【必须】避免相对路径导致的安全问题(DLL、EXE劫持等问题)

在程序中,使用相对路径可能导致一些安全风险,例如DLL、EXE劫持等问题。
例如以下代码,可能存在劫持问题:

  1. int Foo() {
  2. // 传入的是dll文件名,如果当前目录下被写入了恶意的同名dll,则可能导致dll劫持
  3. HINSTANCE hinst = ::LoadLibrary("dll_nolib.dll");
  4. if (hinst != NULL) {
  5. cout<<"dll loaded!" << endl;
  6. }
  7. return 0;
  8. }

针对DLL劫持的安全编码的规范:
1)调用LoadLibrary,LoadLibraryEx,CreateProcess,ShellExecute等进行模块加载的函数时,指明模块的完整(全)路径,禁止使用相对路径,这样就可避免从其它目录加载DLL。
2)在应用程序的开头调用SetDllDirectory(TEXT(“”)); 从而将当前目录从DLL的搜索列表中删除。结合SetDefaultDllDirectories,AddDllDirectory,RemoveDllDirectory这几个API配合使用,可以有效的规避DLL劫持问题。这些API只能在打了KB2533623补丁的Windows7,2008上使用。
关联漏洞:
中风险-逻辑漏洞

5.3 【必须】文件权限控制

在创建文件时,需要根据文件的敏感级别设置不同的访问权限,以防止敏感数据被其他恶意程序读取或写入。
错误:

  1. int Foo() {
  2. // 不要设置为777权限,以防止被其他恶意程序操作
  3. if (creat("file.txt", 0777) < 0) {
  4. printf("文件创建失败!\n");
  5. } else {
  6. printf("文件创建成功!\n");
  7. }
  8. return 0;
  9. }

关联漏洞:
中风险-逻辑漏洞

6 内存操作

6.1 【必须】防止各种越界写(向前/向后)

错误1:

  1. int a[5];
  2. a[5] = 0;

错误2:

  1. int a[5];
  2. int b = user_controlled_value;
  3. a[b] = 3;

关联漏洞:
高风险-内存破坏

6.2 【必须】防止任意地址写

任意地址写会导致严重的安全隐患,可能导致代码执行。因此,在编码时必须校验写入的地址。
错误:

  1. void Write(MyStruct dst_struct) {
  2. char payload[10] = { 0 };
  3. memcpy(dst_struct.buf, payload, sizeof(payload));
  4. }
  5. int main() {
  6. MyStruct dst_stuct;
  7. dst_stuct.buf = (char*)user_controlled_value;
  8. Write(dst_stuct);
  9. return 0;
  10. }

关联漏洞:
高风险-内存破坏

7 数字操作

7.1 【必须】防止整数溢出

在计算时需要考虑整数溢出的可能,尤其在进行内存操作时,需要对分配、拷贝等大小进行合法校验,防止整数溢出导致的漏洞。
错误(该例子在计算时产生整数溢出)

  1. const int kMicLen = 4;
  2. // 整数溢出
  3. void Foo() {
  4. int len = 1;
  5. char payload[10] = { 0 };
  6. char dst[10] = { 0 };
  7. // Bad, 由于len小于4,导致计算拷贝长度时,整数溢出
  8. // len - kMicLen == 0xfffffffd
  9. memcpy(dst, payload, len - kMicLen);
  10. }

正确例子

  1. void Foo() {
  2. int len = 1;
  3. char payload[10] = { 0 };
  4. char dst[10] = { 0 };
  5. int size = len - kMicLen;
  6. // 拷贝前对长度进行判断
  7. if (size > 0 && size < 10) {
  8. memcpy(dst, payload, size);
  9. printf("memcpy good\n");
  10. }
  11. }

关联漏洞:
高风险-内存破坏

7.2 【必须】防止Off-By-One

在进行计算或者操作时,如果使用的最大值或最小值不正确,使得该值比正确值多1或少1,可能导致安全风险。
错误:

  1. char firstname[20];
  2. char lastname[20];
  3. char fullname[40];
  4. fullname[0] = '\0';
  5. strncat(fullname, firstname, 20);
  6. // 第二次调用strncat()可能会追加另外20个字符。如果这20个字符没有终止空字符,则存在安全问题
  7. strncat(fullname, lastname, 20);

正确:

  1. char firstname[20];
  2. char lastname[20];
  3. char fullname[40];
  4. fullname[0] = '\0';
  5. // 当使用像strncat()函数时,必须在缓冲区的末尾为终止空字符留下一个空字节,避免off-by-one
  6. strncat(fullname, firstname, sizeof(fullname) - strlen(fullname) - 1);
  7. strncat(fullname, lastname, sizeof(fullname) - strlen(fullname) - 1);

对于 C++ 代码,再次强烈建议使用 stringvector 等组件代替原始指针和数组操作。
关联漏洞:
高风险-内存破坏

7.3 【必须】避免大小端错误

在一些涉及大小端数据处理的场景,需要进行大小端判断,例如从大端设备取出的值,要以大端进行处理,避免端序错误使用。
关联漏洞:
中风险-逻辑漏洞

7.4 【必须】检查除以零异常

在进行除法运算时,需要判断被除数是否为零,以防导致程序不符合预期或者崩溃。
错误:

  1. int divide(int x, int y) {
  2. return x / y;
  3. }

正确:

  1. int divide(int x, int y) {
  2. if (y == 0) {
  3. throw DivideByZero;
  4. }
  5. return x / y;
  6. }

关联漏洞:
低风险-拒绝服务

7.5 【必须】防止数字类型的错误强转

在有符号和无符号数字参与的运算中,需要注意类型强转可能导致的逻辑错误,建议指定参与计算时数字的类型或者统一类型参与计算。
错误例子

  1. int Foo() {
  2. int len = 1;
  3. unsigned int size = 9;
  4. // 1 < 9 - 10 ? 由于运算中无符号和有符号混用,导致计算结果以无符号计算
  5. if (len < size - 10) {
  6. printf("Bad\n");
  7. } else {
  8. printf("Good\n");
  9. }
  10. }

正确例子

  1. void Foo() {
  2. // 统一两者计算类型为有符号
  3. int len = 1;
  4. int size = 9;
  5. if (len < size - 10) {
  6. printf("Bad\n");
  7. } else {
  8. printf("Good\n");
  9. }
  10. }

关联漏洞:
高风险-内存破坏
中风险-逻辑漏洞

7.6 【必须】比较数据大小时加上最小/最大值的校验

在进行数据大小比较时,要合理地校验数据的区间范围,建议根据数字类型,对其进行最大和最小值的判断,以防止非预期错误。
错误:

  1. void Foo(int index) {
  2. int a[30] = {0};
  3. // 此处index是int型,只考虑了index小于数组大小,但是并未判断是否大于等于0
  4. if (index < 30) {
  5. // 如果index为负数,则越界
  6. a[index] = 1;
  7. }
  8. }

正确:

  1. void Foo(int index) {
  2. int a[30] = {0};
  3. // 判断index的最大最小值
  4. if (index >= 0 && index < 30) {
  5. a[index] = 1;
  6. }
  7. }

关联漏洞:
高风险-内存破坏

8 指针操作

8.1 【建议】检查在pointer上使用sizeof

除了测试当前指针长度,否则一般不会在pointer上使用sizeof。
正确:

  1. size_t pointer_length = sizeof(void*);

可能错误:

  1. size_t structure_length = sizeof(Foo*);

可能是:

  1. size_t structure_length = sizeof(Foo);

关联漏洞:
中风险-逻辑漏洞

8.2 【必须】检查直接将数组和0比较的代码

错误:

  1. int a[3];
  2. ...;
  3. if (a > 0)
  4. ...;

该判断永远为真,等价于:

  1. int a[3];
  2. ...;
  3. if (&a[0])
  4. ...;

可能是:

  1. int a[3];
  2. ...;
  3. if(a[0] > 0)
  4. ...;

开启足够的编译器警告(GCC 中为 -Waddress,并已包含在 -Wall 中),并设置为错误,可以在编译期间发现该问题。
关联漏洞:
中风险-逻辑漏洞

8.3 【必须】不应当向指针赋予写死的地址

特殊情况需要特殊对待(比如开发硬件固件时可能需要写死)
但是如果是系统驱动开发之类的,写死可能会导致后续的问题。
关联漏洞:
高风险-内存破坏

8.4 【必须】检查空指针

错误:

  1. *foo = 100;
  2. if (!foo) {
  3. ERROR("foobar");
  4. }

正确:

  1. if (!foo) {
  2. ERROR("foobar");
  3. }
  4. *foo = 100;

错误:

  1. void Foo(char* bar) {
  2. *bar = '\0';
  3. }

正确:

  1. void Foo(char* bar) {
  2. if(bar)
  3. *bar = '\0';
  4. else
  5. ...;
  6. }

关联漏洞:
低风险-拒绝服务

8.5 【必须】释放完后置空指针

在对指针进行释放后,需要将该指针设置为NULL,以防止后续free指针的误用,导致UAF等其他内存破坏问题。尤其是在结构体、类里面存储的原始指针。
错误:

  1. void foo() {
  2. char* p = (char*)malloc(100);
  3. memcpy(p, "hello", 6);
  4. printf("%s\n", p);
  5. free(p); // 此时p所指向的内存已被释放,但是p所指的地址仍然不变
  6. // 未设置为NULL,可能导致UAF等内存错误
  7. if (p != NULL) { // 没有起到防错作用
  8. printf("%s\n", p); // 错误使用已经释放的内存
  9. }
  10. }

正确:

  1. void foo() {
  2. char* p = (char*)malloc(100);
  3. memcpy(p, "hello", 6);
  4. // 此时p所指向的内存已被释放,但是p所指的地址仍然不变
  5. printf("%s\n", p);
  6. free(p);
  7. //释放后将指针赋值为空
  8. p = NULL;
  9. if (p != NULL) { // 没有起到防错作用
  10. printf("%s\n", p); // 错误使用已经释放的内存
  11. }
  12. }

对于 C++ 代码,使用 string、vector、智能指针等代替原始内存管理机制,可以大量减少这类错误。
关联漏洞:
高风险-内存破坏

8.6 【必须】防止错误的类型转换(type confusion)

在对指针、对象或变量进行操作时,需要能够正确判断所操作对象的原始类型。如果使用了与原始类型不兼容的类型进行访问,则存在安全隐患。
错误:

  1. const int NAME_TYPE = 1;
  2. const int ID_TYPE = 2;
  3. // 该类型根据 msg_type 进行区分,如果在对MessageBuffer进行操作时没有判断目标对象,则存在类型混淆
  4. struct MessageBuffer {
  5. int msg_type;
  6. union {
  7. const char *name;
  8. int name_id;
  9. };
  10. };
  11. void Foo() {
  12. struct MessageBuffer buf;
  13. const char* default_message = "Hello World";
  14. // 设置该消息类型为 NAME_TYPE,因此buf预期的类型为 msg_type + name
  15. buf.msg_type = NAME_TYPE;
  16. buf.name = default_message;
  17. printf("Pointer of buf.name is %p\n", buf.name);
  18. // 没有判断目标消息类型是否为ID_TYPE,直接修改nameID,导致类型混淆
  19. buf.name_id = user_controlled_value;
  20. if (buf.msg_type == NAME_TYPE) {
  21. printf("Pointer of buf.name is now %p\n", buf.name);
  22. // 以NAME_TYPE作为类型操作,可能导致非法内存读写
  23. printf("Message: %s\n", buf.name);
  24. } else {
  25. printf("Message: Use ID %d\n", buf.name_id);
  26. }
  27. }

正确(判断操作的目标是否是预期类型):

  1. void Foo() {
  2. struct MessageBuffer buf;
  3. const char* default_message = "Hello World";
  4. // 设置该消息类型为 NAME_TYPE,因此buf预期的类型为 msg_type + name
  5. buf.msg_type = NAME_TYPE;
  6. buf.name = default_msessage;
  7. printf("Pointer of buf.name is %p\n", buf.name);
  8. // 判断目标消息类型是否为 ID_TYPE,不是预期类型则做对应操作
  9. if (buf.msg_type == ID_TYPE)
  10. buf.name_id = user_controlled_value;
  11. if (buf.msg_type == NAME_TYPE) {
  12. printf("Pointer of buf.name is now %p\n", buf.name);
  13. printf("Message: %s\n", buf.name);
  14. } else {
  15. printf("Message: Use ID %d\n", buf.name_id);
  16. }
  17. }

关联漏洞:
高风险-内存破坏

8.7 【必须】智能指针使用安全

在使用智能指针时,防止其和原始指针的混用,否则可能导致对象生命周期问题,例如 UAF 等安全风险。
错误例子:

  1. class Foo {
  2. public:
  3. explicit Foo(int num) { data_ = num; };
  4. void Function() { printf("Obj is %p, data = %d\n", this, data_); };
  5. private:
  6. int data_;
  7. };
  8. std::unique_ptr<Foo> fool_u_ptr = nullptr;
  9. Foo* pfool_raw_ptr = nullptr;
  10. void Risk() {
  11. fool_u_ptr = make_unique<Foo>(1);
  12. // 从独占智能指针中获取原始指针,<Foo>(1)
  13. pfool_raw_ptr = fool_u_ptr.get();
  14. // 调用<Foo>(1)的函数
  15. pfool_raw_ptr->Function();
  16. // 独占智能指针重新赋值后会释放内存
  17. fool_u_ptr = make_unique<Foo>(2);
  18. // 通过原始指针操作会导致UAF,pfool_raw_ptr指向的对象已经释放
  19. pfool_raw_ptr->Function();
  20. }
  21. // 输出:
  22. // Obj is 0000027943087B80, data = 1
  23. // Obj is 0000027943087B80, data = -572662307

正确,通过智能指针操作:

  1. void Safe() {
  2. fool_u_ptr = make_unique<Foo>(1);
  3. // 调用<Foo>(1)的函数
  4. fool_u_ptr->Function();
  5. fool_u_ptr = make_unique<Foo>(2);
  6. // 调用<Foo>(2)的函数
  7. fool_u_ptr->Function();
  8. }
  9. // 输出:
  10. // Obj is 000002C7BB550830, data = 1
  11. // Obj is 000002C7BB557AF0, data = 2

关联漏洞:
高风险-内存破坏