内存管理是影响软件应用程序性能的一个重要因素。与实际的数据计算时间相比,分配和卸载内存所用的时间更长。
虽然C++可对内存分配与释放进行直接控制,Java利用垃圾收集来回收程序不再需要的内存,试图掌握内存管理。但是,在需要实时性能时,与垃圾收集有关的“暂停”一直是人们反对应对Java的中心论点。
垃圾收集是一个周期性的过程,它中断程序的正常执行,分析对象引用,并回收被分配但不再被引用访问的内存。在大型Java应用程序中,垃圾收集暂停可能持续几秒钟,这段时间足以中断任何类型的实时通信或控制系统。
因此,垃圾收集提供的内存提取要求一些开发者更仔细地考虑内存管理问题。即使Java并没有提供和C++同等级别的内存分配控制,编程模式仍然会对Java应用程序的内存性能产生重大影响。
在本文中,我将简单回顾一下Java 5.0的垃圾收集调整功能。
Java 5.0垃圾收集原理
Java 1.5新特性??工效学??的目标是通过最少的命令行调整,为JVM提供优良的性能。工效学试图为一个应用程序选择最佳的垃圾收集器、堆大小与运行时间编译器。
垃圾收集器的选择何时会对用户产生影响呢?对许多应用程序来说,它根本没有影响。也就是说,在垃圾收集产生的暂停的频率与持续时间适度的情况下,应用程序可在其规范内执行。如果一个大型应用程序出现扩充,产生大量线程、处理器、套接字和许多内存,就会出现例外。
如果一个对象再也不能通过运行程序中的任何指针到达,则视其为垃圾。最直接的垃圾收集运算法则简单地在每个可到达的对象间迭代。那么,剩下的对象即为垃圾。这一方法所用的时间与活动对象的数目成比例关系,且禁止用于维护许多活动数据的大型应用程序。
从Java 2开始,虚拟机合并了许多应用分代收集组合的各种收集运算法则。尽管简单的垃圾收集检查堆中的每一个活动对象,但分代收集利用多数应用程序的几个凭经验观察得到的特性来避免额外工作。这些观察得到的特性中最为重要的一个就是所谓的早期失效率。许多对象分配以后很快“已经死亡”。例如,迭代器对象仅在单独循环中存活。为优化这种情况,我们对内存进行分代管理,或在内存池中保留不同年龄的对象。当一代装满时,就对这个代进行垃圾收集。对象被分配到更年龄对象代,或新生代中。由于早期失效率,多数对象在那里死亡。
如果垃圾收集器成为瓶颈,你可能希望自定义代的大小。详细检查垃圾收集器的输出,然后探究单个性能计量单位对垃圾收集器参数的灵敏度。
初始化时,保留一个最大的地址空间,在必要时才分配给物理内存。为对象内存保留的全部地址空间可分为新生代和旧生代。新生代由eden和两个生存空间组成。对象最初分配到eden中。任何时候,一个生存空间为空,并作为下一个空间的目的地,在eden与另一个生存空间中复制活动对象的集合。对象以这种方式在生存空间中复制,直到它们老化,或复制到旧生代中。与旧生代关系密切的第三个代称为永生代。这是一个特别的代,因为它保留虚拟机所需要的数据,来描述在Java语言中没有等同物的对象。例如,描述类与方法的对象存储在永生代中。
性能因素
Java应用程序(特别是垃圾收集)有两个性能计量单位:吞吐量与暂停。吞吐量是指在一段较长时间内,没有用于垃圾收集的时间百分比。吞吐量包括用于分配的时间(但用于调整分配速度的时间一般不包括在内)。暂停是应用程序因为垃圾收集而出现的停顿时间。
一些用户还对其他因素较为敏感。例如,占用率(footprint) 是一批工作进程的集合,以页和缓冲行数计量,在物理内存有限或者有很多进程的系统中,占用率可表示扩展性。
反应性(Promptness)是对象死去的时间和内存变为可用时的时间差,是分布系统,包括远程方法调用(RMI)中的重要因素。
通常来说,特定的代大小选择这些因素之间的平衡作用。例如,一个非常大的新生代的吞吐量可以最大,但这要以牺牲占用率、反应性和暂停时间为代价。你也可以牺牲吞吐量,应用一个小型的新生代来使新生代暂停时间最短。
如果你希望提高有大量处理器的应用程序的性能,你应该使用吞吐量收集器。你可以用命令行标记-XX:+UseParallelGC来激活吞吐量收集器。你可以用ParallelGCThreads选项-XX:ParallelGCThreads=来控制垃圾收集器线程的数量。
最大暂停时间目标用命令行标记-XX:MaxGCPauseMillis=来指定,这是对吞吐量收集器的一个暗示,即它需要毫秒或更短的暂停时间。存在有许多调整代大小的选项,如-XX:YoungGenerationSizeIncrement=用于新生代;而-XX:TenuredGenerationSizeIncrement=用于旧生代。
如果应用程序受益于较短的垃圾收集器暂停,且能够在应用程序运行时与垃圾收集器共享处理器资源,我建议使用并行低暂停收集器。如果旧生代占用率超出初始占用率(即当前堆的百分比用于并发收集启动之前),并发收集将启动。
默认的初始占用率约为68%.你可以用参数-XX:CMSInitiatingOccupancyFraction=进行设置,这里的是当前旧生代大小百分比。你能够以并发阶段递增完成的方式使用并发收集器。这种模式(这里称之为“i-cms”)将收集器并发完成的工作分割成时间小段,安排在新生代收集之间。当需要并发收集器提供短暂停时间的应用程序在拥有少量处理器的机器上运行时,这一特性很有帮助。