IBM JVM 1.4.1 GC与内存管理

来源：互联网发布：请下载软件猎手编辑：程序博客网时间：2024/05/21 06:35

(本文内容，主要翻译自http://www-106.ibm.com/developerworks/java/jdk/diagnosis/GCandMemory.pdf

1 概述

本文档介绍了IBM JavaVM 1.4.1中的ST（存储组件）的功能和工作原理。

ST组件负责在Heap中分配内存，这些内存可以用于定义对象、数组和类。在内存分配后，如果在JVM中存在一个有效的对它的引用，那么这个对象就被认为是存活的，也就是说，这个对象是可达的。当一个对象不直接或间接的被引用时，它就成为了垃圾，可以被回收，相应的内存可以重新使用。在回收对象时，垃圾回收器（简称GC)必须终止对象，保证对相关联的所有的monitor回收到pool中（这个池一般称为monitor cache)。在ST中，并不是所有的对象的处理都是相同的，有的对象（如ClassClass和Thread)对象总是在Heap种特殊的区域进行分配（PinnedClusters)，所有的Reference对象（包括子对象）在GC中也被特殊的处理。详细的情况在下文中会说明。

1.1 对象分配(Object Allocation)

当调用这些接口方法时，会进行对象的分配：stCacheAlloc, stAllocObject, stAllocArray, stAllocClass。这些方法都从堆中分配给定大小的区域，但有不同的调用参数和语义。stCacheAlloc总是用来分配小的对象，它被优化成为具有良好的性能，对象被直接从线程预先已经创建好的局部堆（Thread Local Allocation Buffer)中分配，一个新的对象总是在这个堆的尾部进行分配，不需要占用全局锁，因此，效率非常高。使用stAllocObject/stAllocArray分配的对象，如果足够小的话（<512字节），也会从从这个局部堆中分配。

1.2 Reachable Objects

一个JVM的活动状态由几部分组成：所有活动线程的运行栈（Stack)，Java Classes的static成员，局部或全局的JNI引用。所有调用的方法都会有一个对应的C栈，这些是构成JVM的所有root对象的集合。在root中会引用堆中的对象，对象又会引用别的对象，这种引用关系会重复以确定所有可达的对象。

1.3 Garbage Collection

当JVM因为缺乏内存而不能在当前的堆中分配一个对象时，能做的第一件事是：对堆进行垃圾回收。这个过程在任何线程调用stGC时启动（可能是因为内存分配失败，或者是对System.gc()的调用）。

首先，JVM要获得进行垃圾回收需要的所有的锁资源，以保证在别的线程持有关键锁时，不会被暂停。所有其它的线程将通过XM接口暂停，保证这些线程的状态可以正确的被当前线程使用。这些状态包括线程栈、执行时刻的寄存器，这些状态时用来跟踪对象引用所必须的。

然后，GC就可以开始了，它包含3个阶段：

标记（Mark）
清扫（Sweep）
压缩（Compaction） (可选)

1.3.1 标记（Mark）阶段

在标记阶段，所有可以从线程堆栈、InternedString、JNI引用中引用到的对象被标记。首先需要创建JVM的root对象集合，在这个集合中的对象，可能会引用到其他对象，因此，下一步要做的就是扫描这些对象以找到所有引用到的对象。这个过程会产生所有一个包含所有存活的对象的向量。在allocbits向量中的每一个二进制位对应于堆中的一个8字节的内存，当该位置1时，表示相应的内存对象是已分配给一个对象的。当GC跟踪堆栈时，它首先比较一个指针是否在堆的范围之内，而后判断这个指针是否是指向一个8对齐的地址，且相应的allocbit已置1，如果满足这些条件的话，GC会把这个指针当作一个对象指针，在markbits向量中设相应的位为1，以表示该对象是被访问到的。（所谓的保守算法，实际上这个可能不是一个指针，例如是一个整数、浮点数）
最后，GC扫描这个对象中的所有字段来确定它引用到的对象。这个扫描过程是精确的，因为对象中存储了元信息，能够为GC提供哪些字段是引用字段（这个信息在ClassLoader装载类时初始化）。

1.3.2 Sweep Phase

在标记阶段完成后，markbits向量中的每一位表示相应的对象是存活的，markbits中的位一定是allocbits的一个子集。清扫阶段的主要目标就是发现二者之间的差异，找到所有存在但不在存活的对象。
在以往的清扫技术中，在堆中自低向上，访问每一个对象，检查队赢得allocbit和markbit，来检测该对象是否是垃圾。现在，由于采用按位清扫的技术，不再需要对堆中对象进行扫描，这样可以避免缺页的风险。在按位清扫时，markbits向量被检查那些连续多个0的区域（这些区域可能是free的），当找到这样的一个区域时，在这个区域前的对象的长度被检查，以确认可以释放的内存空间。

1.3.3 Compaction Phase

在所有的垃圾从堆中清除后，GC可以对剩余的对象进行压缩，这样可以释放位于对象之间的一些空间。由于压缩需要较长的时间，因此，应该尽可能的避免进行压缩。在4.3.1中会详细的描述如何避免压缩。
由于JVM不再使用句柄，因此，压缩是一个复杂的操作。当一个对象移动后，GC必须更新所有对它的引用。如果其中的一个引用来自于堆栈，GC并不能确认这个到底是引用还是其他的数据（比如说一个整数），GC就不能移动这个对象。这些对象被标识为dosed，在对象头中的dosed位置1，以表示这些对象是不能移动的。相似的，有的对象由于在JNI代码中被使用，这些对象被标识为pinned，直到从JNI中显示的释放。其他的对象的压缩通过两个过程来实现。由于mptr对象的低3位总是0，因此，这些位可以保留用来表示这个独享是否已经移动。移动的信息保存在两个位置：link字段（OLINE_IsSwapped)，mptr(GC_FirstSwapped)。

在压缩阶段完成后，所有的线程通过XM接口恢复执行。

TODO
在CSDN上的相关文档：http://blog.csdn.net/snowfalcon/archive/2002/09/22/7172.aspx