在 x86 的计算机系统中,内存空间中的栈主要用于保存函数的参数,返回值,返回地址,本地变量等。一切的函数调用都要将不同的数据、地址压入或者弹出栈。

什么是栈?

栈是一种 LIFO(后进先出)
可以想象下函数调用的时候, 父函数调用子函数,父函数在前,子函数在后。返回的时候子函数先返回,父函数后返回。 ps: 递归就是明显利用函数调用这种栈的结构来实现的。

什么是栈帧?

栈帧本质上是一种栈,只是这种栈专门用于保存函数调用过程中的各种信息(参数,返回地址,本地变量等)。栈帧有栈顶和栈底之分,其中栈顶的地址最低,栈底的地址最高。

两个主要寄存器

1. ESP 寄存器
栈指针寄存器 (extended stack pointer),其内存放着一个指针,该指针永远指向系统栈最上面一个栈帧的栈顶。

2.EBP 寄存器
基址指针寄存器(extended base pointer),其内存放着一个指针,该指针永远指向系统栈最上面一个栈帧的底部。

浅析函数调用的栈帧 - 知乎 - 图1

一般来说,我们将 %ebp%esp 之间区域当做栈帧(也有人认为该从函数参数开始,不过这不影响分析)。并不是整个栈空间只有一个栈帧,每调用一个函数,就会生成一个新的栈帧。在函数调用过程中,我们将调用函数的函数称为 “调用者(caller)”,将被调用的函数称为“被调用者(callee)”。在这个过程中,1)“调用者” 需要知道在哪里获取 “被调用者” 返回的值;2)“被调用者”需要知道传入的参数在哪里,3)返回的地址在哪里。同时,我们需要保证在 “被调用者” 返回后,%ebp, %esp 等寄存器的值应该和调用前一致。因此,我们需要使用栈来保存这些数据。

函数调用实例

函数的调用

  1. //被调函数 callee
  2. int CalleeFunction(int x, int y, int z)
  3. {
  4. int a, b, c;
  5. a = 4;
  6. b = 5;
  7. c = 6;
  8. return;
  9. }
  10. //主调函数 caller
  11. int CallerFunction()
  12. {
  13. int x = 1, y = 2, z = 3;
  14. //调用被调函数
  15. CalleeFunction(1, 2, 3);
  16. ...
  17. }

我们来看下 Callee 函数的汇编代码

  1. _CalleeFunction:
  2. push %ebp ; //保存%ebp的值
  3. movl %esp, $ebp ; //将%esp的值赋给%ebp,使新的%ebp指向栈顶
  4. movl -12(%esp), %esp ; //分配额外空间给本地变量
  5. movl $4, -4(%ebp) ;
  6. movl $5, -8(%ebp) ;
  7. movl $6, -12(%ebp) ;

此时调用者做了两件事情:第一,将被调用函数的参数按照从右到左的顺序压入栈中。第二,将返回地址压入栈中。这两件事都是调用者负责的,因此压入的栈应该属于调用者的栈帧。我们再来看看被调用者,它也做了两件事情:第一,将老的(调用者的) %ebp 压入栈,此时 %esp 指向它。第二,将 %esp 的值赋给 %ebp, %ebp 就有了新的值,它也指向存放老 %ebp 的栈空间。这时,它成了是函数 CalleeFunction() 栈帧的栈底。这样,我们就保存了 “调用者” 函数的 %ebp,并且建立了一个新的栈帧。

浅析函数调用的栈帧 - 知乎 - 图2

%ebp 更新后,我们先分配一块 0x12 字节的空间用于存放本地变量,这步一般都是用 sub 或者 mov 指令实现。在这里使用的是 movl。通过使用 mov 配合 -4(%ebp), -8(%ebp)-12(%ebp) 我们便可以给 a, bc 赋值了。

浅析函数调用的栈帧 - 知乎 - 图3

函数返回

和调用函数时正好相反。当函数完成自己的任务后,它会将 %esp 移到 %ebp 处,然后再弹出旧的 %ebp 的值到 %ebp。这样,%ebp 就恢复到了函数调用前的状态。

  1. //被调函数 callee
  2. int CalleeFunction(int x, int y, int z)
  3. {
  4. int a, b, c;
  5. ...
  6. return;
  7. }

汇编代码

  1. _CalleeFunction:
  2. push %ebp
  3. movl %esp, %ebp
  4. movl -12(%esp), %esp
  5. ...
  6. mov %ebp, %esp
  7. pop %ebp
  8. ret

ret 指令,这个指令相当于 pop + jum。它首先将数据(返回地址)弹出栈并保存到 %eip 中,然后处理器根据这个地址无条件地跳到相应位置获取新的指令。

浅析函数调用的栈帧 - 知乎 - 图4

被调用函数返回后的栈帧

小结

这批函数栈帧分析为基础 方便大家理解 golang 启动过程中对栈帧的一系列操作,比如最骚的把 goexit() 塞入到newg 的栈顶等过程~
https://zhuanlan.zhihu.com/p/425119402