IBM JVM 1.4.1 GC与内存管理

来源:互联网 发布:请下载软件猎手 编辑:程序博客网 时间:2024/05/21 06:35
(本文内容,主要翻译自http://www-106.ibm.com/developerworks/java/jdk/diagnosis/GCandMemory.pdf

1 概述

本文档介绍了IBM JavaVM 1.4.1中的ST(存储组件)的功能和工作原理。

ST组件负责在Heap中分配内存,这些内存可以用于定义对象、数组和类。在内存分配后,如果在JVM中存在一个有效的对它的引用,那么这个对象就被认为是存活的,也就是说,这个对象是可达的。当一个对象不直接或间接的被引用时,它就成为了垃圾,可以被回收,相应的内存可以重新使用。在回收对象时,垃圾回收器(简称GC)必须终止对象,保证对相关联的所有的monitor回收到pool中(这个池一般称为monitor cache)。在ST中,并不是所有的对象的处理都是相同的,有的对象(如ClassClass和Thread)对象总是在Heap种特殊的区域进行分配(PinnedClusters),所有的Reference对象(包括子对象)在GC中也被特殊的处理。详细的情况在下文中会说明。

1.1 对象分配(Object Allocation)

当调用这些接口方法时,会进行对象的分配:stCacheAlloc, stAllocObject, stAllocArray, stAllocClass。这些方法都从堆中分配给定大小的区域,但有不同的调用参数和语义。stCacheAlloc总是用来分配小的对象,它被优化成为具有良好的性能,对象被直接从线程预先已经创建好的局部堆(Thread Local Allocation Buffer)中分配,一个新的对象总是在这个堆的尾部进行分配,不需要占用全局锁,因此,效率非常高。使用stAllocObject/stAllocArray分配的对象,如果足够小的话(<512字节),也会从从这个局部堆中分配。

1.2 Reachable Objects

一个JVM的活动状态由几部分组成:所有活动线程的运行栈(Stack),Java Classes的static成员,局部或全局的JNI引用。所有调用的方法都会有一个对应的C栈,这些是构成JVM的所有root对象的集合。在root中会引用堆中的对象,对象又会引用别的对象,这种引用关系会重复以确定所有可达的对象。

1.3 Garbage Collection

当JVM因为缺乏内存而不能在当前的堆中分配一个对象时,能做的第一件事是:对堆进行垃圾回收。这个过程在任何线程调用stGC时启动(可能是因为内存分配失败,或者是对System.gc()的调用)。

首先,JVM要获得进行垃圾回收需要的所有的锁资源,以保证在别的线程持有关键锁时,不会被暂停。所有其它的线程将通过XM接口暂停,保证这些线程的状态可以正确的被当前线程使用。这些状态包括线程栈、执行时刻的寄存器,这些状态时用来跟踪对象引用所必须的。

然后,GC就可以开始了,它包含3个阶段:

  1. 标记(Mark)
  2. 清扫(Sweep)
  3. 压缩(Compaction) (可选)

1.3.1 标记(Mark)阶段

在标记阶段,所有可以从线程堆栈、InternedString、JNI引用中引用到的对象被标记。首先需要创建JVM的root对象集合,在这个集合中的对象,可能会引用到其他对象,因此,下一步要做的就是扫描这些对象以找到所有引用到的对象。这个过程会产生所有一个包含所有存活的对象的向量。在allocbits向量中的每一个二进制位对应于堆中的一个8字节的内存,当该位置1时,表示相应的内存对象是已分配给一个对象的。当GC跟踪堆栈时,它首先比较一个指针是否在堆的范围之内,而后判断这个指针是否是指向一个8对齐的地址,且相应的allocbit已置1,如果满足这些条件的话,GC会把这个指针当作一个对象指针,在markbits向量中设相应的位为1,以表示该对象是被访问到的。(所谓的保守算法,实际上这个可能不是一个指针,例如是一个整数、浮点数)
最后,GC扫描这个对象中的所有字段来确定它引用到的对象。这个扫描过程是精确的,因为对象中存储了元信息,能够为GC提供哪些字段是引用字段(这个信息在ClassLoader装载类时初始化)。

1.3.2 Sweep Phase

在标记阶段完成后,markbits向量中的每一位表示相应的对象是存活的,markbits中的位一定是allocbits的一个子集。清扫阶段的主要目标就是发现二者之间的差异,找到所有存在但不在存活的对象。
在以往的清扫技术中,在堆中自低向上,访问每一个对象,检查队赢得allocbit和markbit,来检测该对象是否是垃圾。现在,由于采用按位清扫的技术,不再需要对堆中对象进行扫描,这样可以避免缺页的风险。在按位清扫时,markbits向量被检查那些连续多个0的区域(这些区域可能是free的),当找到这样的一个区域时,在这个区域前的对象的长度被检查,以确认可以释放的内存空间。

1.3.3 Compaction Phase

在所有的垃圾从堆中清除后,GC可以对剩余的对象进行压缩,这样可以释放位于对象之间的一些空间。由于压缩需要较长的时间,因此,应该尽可能的避免进行压缩。在4.3.1中会详细的描述如何避免压缩。
由于JVM不再使用句柄,因此,压缩是一个复杂的操作。当一个对象移动后,GC必须更新所有对它的引用。如果其中的一个引用来自于堆栈,GC并不能确认这个到底是引用还是其他的数据(比如说一个整数),GC就不能移动这个对象。这些对象被标识为dosed,在对象头中的dosed位置1,以表示这些对象是不能移动的。相似的,有的对象由于在JNI代码中被使用,这些对象被标识为pinned,直到从JNI中显示的释放。其他的对象的压缩通过两个过程来实现。由于mptr对象的低3位总是0,因此,这些位可以保留用来表示这个独享是否已经移动。移动的信息保存在两个位置:link字段(OLINE_IsSwapped),mptr(GC_FirstSwapped)。

在压缩阶段完成后,所有的线程通过XM接口恢复执行。

TODO
在CSDN上的相关文档:http://blog.csdn.net/snowfalcon/archive/2002/09/22/7172.aspx

原创粉丝点击