本文由 简悦 SimpRead 转码, 原文地址 blog.csdn.net
在 php 中的变量占用的空间,是不需要我们手动回收的。内核帮我们处理了这一部分的工作。相比 C,这大大方便了我们的操作。
本篇主要讲解 变量的 GC 机制
在了解我们 php GC 时,我觉得我有必要介绍一下们的 php 的变量在底层的实现。
zval 的结构
// php 变量对于的c结构体
struct _zval_struct {
zend_value value;
union {
……
} u1;
union {
……
} u2;
};
由于主要讲垃圾回收,所以在这里简单介绍下 u1 u2 联合体的功能u1
结构比较复杂,我认为主要是用于识别变量类型u2
这里面大多都是辅助字段,变量内部功能的实现、提升缓存友好性等等
接下来是我们的主角
zend_value
它也是结构体中内嵌的一个联合体
typedef union _zend_value {
zend_long lval;//整形
double dval;//浮点型
zend_refcounted *counted;//获取不同类型的gc头部
zend_string *str;//string字符串
zend_array *arr;//数组
zend_object *obj;//对象
zend_resource *res;//资源
zend_reference *ref;//是否是引用类型
// 忽略下面的结构,与我们讨论无关
zend_ast_ref *ast;
zval *zv;
void *ptr;
zend_class_entry *ce;
zend_function *func;
struct {
ZEND_ENDIAN_LOHI(
uint32_t w1,
uint32_t w2)
} ww;
} zend_value;
在 zval
的 value 中就记录了引用计数zend_refcounted *counted
这个类型,我们的垃圾回收机制也是基于此的。
typedef struct _zend_refcounted_h {
uint32_t refcount; /* reference counter 32-bit */
union {
struct {
ZEND_ENDIAN_LOHI_3(
zend_uchar type,
zend_uchar flags, /* used for strings & objects */
uint16_t gc_info) /* keeps GC root number (or 0) and color */
} v;
uint32_t type_info;
} u;
} zend_refcounted_h;
所有的复杂类型的定义, 开始的时候都是zend_refcounted_h
结构, 这个结构里除了引用计数以外, 还有 GC 相关的结构. 从而在做 GC 回收的时候, GC 不需要关心具体类型是什么, 所有的它都可以当做zend_refcounted*
结构来处理.
变量的自动回收
在 php 中 除了 array
和object
类型的变量,其余大部分是自动回收
php 普通变量的回收和该变量的引用次数有关。
官方的例子
$a = 1;
$b = $a;
xdebug_debug_zval('a');
$a =10;
xdebug_debug_zval('a');
unset($a);
xdebug_debug_zval('a');
结果
a:
(refcount=2, is_ref=0),int 1
a:
(refcount=1, is_ref=0),int 10
a: no such symbol
可以看到 当$a =10
的时候 涉及到 php 的 COW(copy-on-write)写时拷贝机制,$b 会复制一份原先的 $a ,解除了他们之间的引用关系,所以 a 的引用次数(refcount)减少为 1。
写时复制(Copy On Write:COW),简单描述为:如果通过赋值的方式赋值给变量时不会申请新内存来存放新变量所保存的值,而是简单的通过一个计数器来共用内存,只有在其中的一个引用指向变量的值发生变化时,才申请新空间来保存值内容以减少对内存的占用。 - TPIP 写时复制
然后我们 unset($a) 之后 a 的引用次数变为 0。这就会被认为是垃圾变量,释放空间。
循环引用问题
$a = [1];
$a[1] = &$a;
xdebug_debug_zval('a');
unset($a);
在 unset($a) 之前 $a 的类型为引用类型
a:
(refcount=2, is_ref=1),
array (size=2)
0 => (refcount=1, is_ref=0),int 1
1 => (refcount=2, is_ref=1),
&array<
unset($a) 之后,就变成这样
这时候,我们unset
操作时 refcount 由 2 变为 1, 因为有内部引用指向 $a,所以在外部 其所占用的空间并不会被销毁。
然后我们的外部引用已经被中断了,我们也不能使用它。它就成了一个 “孤儿”,在 c 语言中叫做野指针。在 php 中叫做循环引用。内存泄漏。
幸运的是 php 将在脚本执行结束时清除这个数据结构,但是在 php 清除之前,将耗费不少内存。尤其在长时间运行的脚本中(例如守护程序,一直在后台执行不会中断),由于无法回收内存,最终会导致系统“再无内存可用”。
垃圾回收原理
如果发现一个zval容器中的refcount在增加,说明不是垃圾;
- 如果引用计数减少到零,所在变量容器将被清除 (free);PHP垃圾回收器不必回收这种垃圾,直接清除即可。
- 如果一个 zval 的引用计数减少后还大于 0,那么它会进入PHP的垃圾回收器中。其次,在一个垃圾周期中,通过尝试将引用计数减 1,并且检查哪些变量容器的引用次数是零,来发现哪部分是垃圾。
循环引用基本上只会出现在 数组和对象中(对象是因为它的本身就是引用),像一个子元素指向它的父元素这种情况就有可能会发生
垃圾回收过程
php7 的垃圾回收包含两个部分,一个是垃圾收集器,一个是垃圾回收算法。
垃圾收集器,把一个 zval 的引用计数减少后还大于 0的,可能是垃圾的元素收集到回收池中, 也就是把变量的 zend_refcount>0
的变量 放在回收池中(缓存区)。 当回收池的值达到一定额度了,会进行统一遍历处理。进行模拟删除, 进行refcount -1操作,如果zend_refcount=0
那就认为是垃圾,直接删除它。
遍历回收池中的每一个变量,根据每一个变量,再遍历每一个成员,如果成员还有嵌套的话继续遍历。然后把所有成员的 做模拟的 refcount -1。
如果此时外部的变量的 引用次数为 0 。那么可以视为垃圾,进行清除。
如果大于 0,那么恢复引用次数,并从垃圾回收池中取出。
如果你这个变量不是垃圾,那么它的所有成员变量的引用减一之后,总变量的引用次数必然不会为 0。
例子
题目如下
1、只要zval.value的refcount减一,refcount的值不为0那么它就可能是垃圾,进入垃圾周期。
2、进入垃圾池遍历所有成员,包括其嵌套的成员,都对其做 refcount-1的操作,看外部的引用是否为0。
那么对于 题主的问题来说,
首先,你要想$a为垃圾,一定要先对 unset($a)操作,那么此时 $a的 refcount = 2,引用次数大于0,所以可能是垃圾啊,进入垃圾回收周期。
对于$a[0] refcount-1 不影响外部的$a,
$a[1] refcount-1 ,此时 $a的 refount=1
$a[2] refcount-1 ,此时 $a 的 refount=0
模拟减结束,那么此变量被当成垃圾销毁。