PHP的垃圾回收机制——引用计数

每个php变量存在一个叫"zval"的变量容器中。一个zval变量容器,除了包含变量的类型和值,还包括两个字节的额外信息。第一个是"is_ref",是个bool值,用来标识这个变量是否是属于引用集合(reference

set)。通过这个字节,php引擎才能把普通变量和引用变量区分开来,由于php允许用户通过使用&来使用自定义引用,zval变量容器中还有一个内部引用计数机制,来优化内存使用。第二个额外字节是"refcount",用以表示指向这个zval变量容器的变量(也称符号即symbol)个数。所有的符号存在一个符号表中,其中每个符号都有作用域(scope),那些主脚本(比如:通过浏览器请求的的脚本)和每个函数或者方法也都有作用域。

当一个变量被赋常量值时,就会生成一个zval变量容器,如下例这样:

例1 生成一个新的zval容器


  1. <?php  
  2.  
  3. $a = "new string"; 
  4.  
  5. ?> 

在上例中,新的变量a,是在当前作用域中生成的。并且生成了类型为 string 和值为new
string的变量容器。在额外的两个字节信息中,"is_ref"被默认设置为 FALSE,因为没有任何自定义的引用生成。"refcount"
被设定为 1,因为这里只有一个变量使用这个变量容器. 注意到当"refcount"的值是1时,"is_ref"的值总是FALSE.
如果你已经安装了» Xdebug,你能通过调用函数 xdebug_debug_zval()显示"refcount"和"is_ref"的值。

例2 显示zval信息


  1. <?php  
  2.  
  3. xdebug_debug_zval('a'); 
  4.  
  5. ?> 

以上例程会输出:


  1. a: (refcount=1, is_ref=0)='new string' 

把一个变量赋值给另一变量将增加引用次数(refcount).

例3 增加一个zval的引用计数


  1. <?php 
  2.  $a = "new string"; 
  3.  
  4. $b = $a; 
  5.  
  6. xdebug_debug_zval( 'a' ); 
  7.  
  8. ?> 

以上例程会输出:


  1. a: (refcount=2, is_ref=0)='new string' 

这时,引用次数是2,因为同一个变量容器被变量 a 和变量
b关联.当没必要时,php不会去复制已生成的变量容器。变量容器在”refcount“变成0时就被销毁.
当任何关联到某个变量容器的变量离开它的作用域(比如:函数执行结束),或者对变量调用了函数
unset()时,”refcount“就会减1,下面的例子就能说明:

例4 减少引用计数


  1. <?php  
  2.  
  3. $a = "new string"; 
  4.  
  5. $c = $b = $a; 
  6.  
  7. xdebug_debug_zval( 'a' ); 
  8.  
  9. unset( $b, $c ); 
  10.  
  11. xdebug_debug_zval( 'a' ); 
  12.  
  13. ?> 

以上例程会输出:


  1. a: (refcount=3, is_ref=0)='new string' 
  2.  
  3. a: (refcount=1, is_ref=0)='new string' 

如果我们现在执行 unset($a);,包含类型和值的这个变量容器就会从内存中删除。

复合类型(Compound Types)

当考虑像 array和object这样的复合类型时,事情就稍微有点复杂. 与 标量(scalar)类型的值不同,array和 object类型的变量把它们的成员或属性存在自己的符号表中。这意味着下面的例子将生成三个zval变量容器。

例5 Creating a array zval


  1. <?php  
  2.  
  3. $a = array( 'meaning' => 'life', 'number' => 42 ); 
  4.  
  5. xdebug_debug_zval( 'a' ); 
  6.  
  7. ?> 

以上例程的输出类似于:


  1. a: (refcount=1, is_ref=0)=array ( 
  2.    'meaning' => (refcount=1, is_ref=0)='life', 
  3.    'number' => (refcount=1, is_ref=0)=42 

图示:

一个简单数组的zval

这三个zval变量容器是: a,meaning和 number。增加和减少”refcount”的规则和上面提到的一样. 下面, 我们在数组中再添加一个元素,并且把它的值设为数组中已存在元素的值:

例6 添加一个已经存在的元素到数组中


  1. <?php  
  2.  
  3. $a = array( 'meaning' => 'life', 'number' => 42 ); 
  4.  
  5. $a['life'] = $a['meaning']; 
  6.  
  7. xdebug_debug_zval( 'a' ); 
  8.  
  9. ?> 

以上例程的输出类似于:


  1. a: (refcount=1, is_ref=0)=array ( 
  2.  
  3. 'meaning' => (refcount=2, is_ref=0)='life', 
  4.  
  5. 'number' => (refcount=1, is_ref=0)=42, 
  6.  
  7. 'life' => (refcount=2, is_ref=0)='life' 
  8.  

图示:

带有引用的简单数组的zval

从以上的xdebug输出信息,我们看到原有的数组元素和新添加的数组元素关联到同一个"refcount"2的zval变量容器. 尽管
Xdebug的输出显示两个值为'life'的 zval 变量容器,其实是同一个。
函数xdebug_debug_zval()不显示这个信息,但是你能通过显示内存指针信息来看到。

删除数组中的一个元素,就是类似于从作用域中删除一个变量. 删除后,数组中的这个元素所在的容器的“refcount”值减少,同样,当“refcount”为0时,这个变量容器就从内存中被删除,下面又一个例子可以说明:

例7 从数组中删除一个元素


  1. <?php  
  2.  
  3. $a = array( 'meaning' => 'life', 'number' => 42 ); 
  4.  
  5. $a['life'] = $a['meaning']; 
  6.  
  7. unset( $a['meaning'], $a['number'] ); 
  8.  
  9. xdebug_debug_zval( 'a' ); 
  10.  
  11. ?> 

以上例程的输出类似于:


  1. a: (refcount=1, is_ref=0)=array ( 
  2.  
  3. 'life' => (refcount=1, is_ref=0)='life' 
  4.  

现在,当我们添加一个数组本身作为这个数组的元素时,事情就变得有趣,下个例子将说明这个。例中我们加入了引用操作符,否则php将生成一个复制。

例8 把数组作为一个元素添加到自己


  1. <?php  
  2.  
  3. $a = array( 'one' ); 
  4.  
  5. $a[] =&$a; 
  6.  
  7. xdebug_debug_zval( 'a' ); 
  8.  
  9. ?> 

以上例程的输出类似于:


  1. a: (refcount=2, is_ref=1)=array ( 
  2.  
  3. 0 => (refcount=1, is_ref=0)='one', 
  4.  
  5. 1 => (refcount=2, is_ref=1)=... 
  6.  

图示:

自引用(curcular reference,自己是自己的一个元素)的数组的zval

能看到数组变量 (a) 同时也是这个数组的第二个元素(1) 指向的变量容器中“refcount”为 2。上面的输出结果中的"..."说明发生了递归操作, 显然在这种情况下意味着"..."指向原始数组。

跟刚刚一样,对一个变量调用unset,将删除这个符号,且它指向的变量容器中的引用次数也减1。所以,如果我们在执行完上面的代码后,对变量$a调用unset,
那么变量 $a 和数组元素 "1" 所指向的变量容器的引用次数减1, 从"2"变成"1". 下例可以说明:

例9 Unsetting $a


  1. (refcount=1, is_ref=1)=array ( 
  2.    0 => (refcount=1, is_ref=0)='one', 
  3.    1 => (refcount=1, is_ref=1)=... 

图示:

Zvals after removal of array with a circular reference demonstrating the memory leak

清理变量容器的问题(Cleanup Problems)

尽管不再有某个作用域中的任何符号指向这个结构(就是变量容器),由于数组元素“1”仍然指向数组本身,所以这个容器不能被清除
。因为没有另外的符号指向它,用户没有办法清除这个结构,结果就会导致内存泄漏。庆幸的是,php将在脚本执行结束时清除这个数据结构,但是在php清除之前,将耗费不少内存。如果你要实现分析算法,或者要做其他像一个子元素指向它的父元素这样的事情,这种情况就会经常发生。当然,同样的情况也会发生在对象上,实际上对象更有可能出现这种情况,因为对象总是隐式的被引用。

如果上面的情况发生仅仅一两次倒没什么,但是如果出现几千次,甚至几十万次的内存泄漏,这显然是个大问题。这样的问题往往发生在长时间运行的脚本中,比如请求基本上不会结束的守护进程(deamons)或者单元测试中的大的套件(sets)中。后者的例子:在给巨大的eZ(一个知名的PHP
Library) 组件库的模板组件做单元测试时,就可能会出现问题。有时测试可能需要耗用2GB的内存,而测试服务器很可能没有这么大的内存。

来源:51CTO

时间: 2024-11-02 18:10:27

PHP的垃圾回收机制——引用计数的相关文章

PHP垃圾回收机制引用计数器概念分析_php技巧

如果你安装了xdebug,就可以用xdebug_debug_zval()显示"zval"的信息了.如下: 复制代码 代码如下: <?php$str = "jb51.net";xdebug_debug_zval('str'); 结果: str:(refcount=1, is_ref=0),string 'jb51.net' (length=10) 只有当变量容器在"refcount"变成0时就被销毁.当你unset()一个变量时,想要的&qu

JavaScript 垃圾回收机制分析_javascript技巧

在公司经常会听到大牛们讨论时说道内存泄露神马的,每每都惊羡不已,最近精力主要用在了Web 开发上,读了一下<JavaScript高级程序设计>(书名很唬人,实际作者写的特别好,由浅入深)了解了一下JavaScript垃圾回收机制,对内存泄露有了一定的认识. 和C#.Java一样JavaScript有自动垃圾回收机制,也就是说执行环境会负责管理代码执行过程中使用的内存,在开发过程中就无需考虑内存分配及无用内存的回收问题了.JavaScript垃圾回收的机制很简单:找出不再使用的变量,然后释放掉其

析JAVA之垃圾回收机制

本文为2010年编写,所以有很多看法不是很准确,有一定的参考价值,如需要更加深入细节,请参看,2012年编写的关于JVM的文章: 认识JVM--第一篇-对象生成&回收算法 认识JVM--第二篇-java对象内存模型 JVM第三篇(简单demo) 系统架构-性能篇章1(应用系统性能2-OOM&参数配置) 相继的还会有更多的java深入的知识和机制. 对于JAVA编程和很多类似C.C++语言有一个巨大区别就是内存不需要自己去free或者delete,而是由JVM垃圾回收机制去完成的.对于这个过

【转载】关于垃圾回收机制

转载自[雨声论坛]原作:software_young ----------------------转载开始------------------------所谓垃圾回收机制,指的是内存和各种变量或者目标所使用内存的释放和回收机制. 软件的发展历史,就是软件不断庞大.人力逐渐难以控制和对开发人员的技术要求逐渐降低的历史. 早先的许多软件,都是用汇编语言写的,汇编是机器码的助记符方式,因此,用汇编编程,实际就是用机器码编程.它要求程序员对机器非常熟悉才行,否则很难编出能用的程序. 那时候的程序员首先要

Java的垃圾回收机制研究

一.谁在做Garbage Collection? 一种流行的说法:在C++里,是系统在做垃圾回收;而在Java里,是Java自身在做. 在C++里,释放内存是手动处理的,要用delete运算符来释放分配的内存.这是流行的说法.确切地说,是应用认为不需要某实体时,就需用delete告诉系统,可以回收这块空间了.这个要求,对编码者来说,是件很麻烦.很难做到的事.随便上哪个BBS,在C/C++版块里总是有一大堆关于内存泄漏的话题. Java采用一种不同的,很方便的方法:Garbage Collecti

Python垃圾回收机制总结

Python 垃圾回收机制 内存管理 Python中的内存管理机制的层次结构提供了4层,其中最底层则是C运行的malloc和free接口,往上的三层才是由Python实现并且维护的,第一层则是在第0层的基础之上对其提供的接口进行了统一的封装,因为每个系统都可能差异性.   内存池 Python为了避免频繁的申请和删除内存所造成系统切换于用户态和核心态的性能问题,从而引入了内存池机制,专门用来管理小内存的申请和释放.内存池分为四层:block.pool.arena和内存池.如下图: block:有

C++ 为什么不加入垃圾回收机制

Java的爱好者们经常批评C++中没有提供与Java类似的垃圾回收(Gabage Collector)机制(这很正常,正如C++的爱好者有时也攻击Java没有这个没有那个,或者这个不行那个不够好),导致C++中对动态存储的官吏称为程序员的噩梦,不是吗?你经常听到的是内存遗失(memory leak)和非法指针存取,这一定令你很头疼,而且你又不能抛弃指针带来的灵活性. 在本文中,我并不想揭露Java提供的垃圾回收机制的天生缺陷,而是指出了C++中引入垃圾回收的可行性.请读者注意,这里介绍的方法更多

PHP垃圾回收机制详解

PHP的基本GC概念 PHP语言同其他语言一样,具有垃圾回收机制.那么今天我们要为大家讲解的内容就是关于PHP垃圾回收机制的相关问题.希望对大家有所帮助. PHP strtotime应用经验之谈PHP memory_get_usage()管理内存PHP unset全局变量运用问题详解PHP unset()函数销毁变量教你快速实现PHP全站权限验证一.PHP 垃圾回收机制(Garbage Collector 简称GC) 在PHP中,没有任何变量指向这个对象时,这个对象就成为垃圾.PHP会将其在内存

.Net 垃圾回收机制原理(二)

英文原文:Jeffrey Richter 编译:赵玉开 链接http://www.cnblogs.com/yukaizhao/archive/2011/11/25/dot_net_GC_2.html 上一篇文章介绍了.Net 垃圾回收的基本原理和垃圾回收执行Finalize方法的内部机制:这一篇我们看下弱引用对象,代,多线程垃圾回收,大对象处理以及和垃圾回收相关的性能计数器. 让我们从弱引用对象说起,弱引用对象可以减轻大对象带来的内存压力.弱引用(Weak References) 当程序的根对象