深入理解G1垃圾收集器

来源：互联网发布：谁人知歌词编辑：程序博客网时间：2024/05/17 22:36

Garbage First(G1)致力于在多CPU和大内存服务器上对垃圾收集提供软实时目标(soft real-time goal )和高吞吐量(high throughput )。从JDK 6u14开始就已经在Hotspot上试验，到现在的JDK7依然没有走出实验室。是最终将用于代替Concurrent Mark-Sweep garbage collector(CMS GC)的新一代垃圾回收器。目前JDK1.6update14及以后版本的jvm中已经继承了G1 GC，可以使用参数-XX:+UnlockExperimentalVMOptions -XX:+UseG1GC来启用。G1是一个适用于服务器端、大内存、多CPU情景的垃圾收集器，主要目标是在维持高效率回收(high thoughput)的同时，提供软实时中断特性。用户可以指定一个时间上限，如果垃圾回收导致的程序暂停超过了用户设定的时间上限，会打断垃圾回收，恢复程序的执行。

根据经验贴一段设置
-server -verbose:gc -Xms10240m -Xmx10240 -XX:PermSize=128m -XX:MaxPermSize=128m -Xss256k -Xloggc:${LOG_HOME}/logs/gc.log -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=${LOG_HOME}/logs/HeapDumpOnOutOfMemoryError.log -XX:+UnlockExperimentalVMOptions -XX:+UseG1GC -XX:MaxGCPauseMillis=10 -XX:GCPauseIntervalMillis=200 -XX:+DisableExplicitGC -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps

关于region：

在G1中，heap被平均分成若干个大小相等的区域(region)。每个region都有一个关联的remembered set (RS)，RS的数据结构是hash table，里面的数据是card table (heap中每512byte映射在card table 1byte)。简单的说RS里面存在的是region中live objects的指针。当region中数据发生变化时，首先反映到card table中的一个或多个card上，RS通过扫描内部的card table得知region中内存使用情况和存活对象。

关于内存分配：

由于G1主要关注于多CPU多线程，所以内存分配采用 thread-local allocation buffers (TLABs)技术。每个分配线程都有一个自己的buffers用来分配对象，当buffers用完或者不够的时候，去重新申请一块内存放在自己的thread-local里面。这样对象的内存分配被最小化到私有的buffers里面，缓解了并发分配内存的压力。

当region被填满后，分配内存的线程会重新选择一个新的region。空region被组织到一个linked list里面，这样可以快速找到新的region。

对于大对象的分配不是在TLABs进行的，而是在TLABs之外。当一个对象的大小超过region的3/4的时候，这个对象被认为是巨大的(humongous )。巨大的对象被分配到特殊的区域(heap regions )。这些区域只包含巨大对象(humongous object )。

执行过程：

●初始标记 :Initial Marking

●并发标记 :Concurrent Marking

●最终标记 :Final Marking

●计数并清理 :Live Data Counting and Cleanup

G1执行的第一阶段是初始标记(Initial Marking ),这个阶段是STW(Stop the World )的，所有mutator threads将被停止，标记出从GC Root开始直接可达的对象。然后，所有mutator threads将被重启，进入并发标记(Concurrent Marking )阶段。这个阶段从GC Root开始对heap中的对象标记，标记线程与应用程序线程并行直接，耗时较长。当并发标记完成后，开始最终标记(Final Marking )阶段。这个阶段主要是标记那些在并发标记阶段发生变化的对象。同样最终标记也要STW，但是多个标记线程并行运行，很快就可以完成。最后一个阶段会对每个区域(region)的回收成本和价值进行排序，根据用户指定的停顿时间，选择性的收集某些区域的对象，并统计每个区域对象的数量。

与CMS对比：

总体来说，G1跟CMS一样，是一块低延时的收集器，同样牺牲了吞吐量，不过二者之间得到了很好的权衡。

G1与CMS对比有一下不同：

1.分代： CMS中，堆被分为PermGen，YoungGen，OldGen；而YoungGen又分了两个survivo区域。在G1中，堆被平均分成几个区域(region)，在每个区域中，虽然也保留了新老代的概念，但是收集器是以整个区域为单位收集的。

2.算法：相对于CMS的“标记——清理”算法，G1会使用压缩算法，保证不产生多余的碎片。收集阶段，G1会将某个区域存活的对象拷贝的其他区域，然后将整个区域整个回收。

3.停顿时间可控：为了缩短停顿时间，G1建立可预存停顿模型，这样在用户设置的停顿时间范围内，G1会选择适当的区域进行收集，确保停顿时间不超过用户指定时间。

0 0