垃圾收集器和内存分配策略

来源：互联网发布：tomcat 域名绑定编辑：程序博客网时间：2024/05/21 13:33

刚刚在前面介绍了内存的运行时数据区域，其中程序计数器、虚拟机栈、本地方法栈3个区域随线程而生，随线程而灭。栈中的栈帧随着方法的进入和退出而有条不紊的执行着入栈和出栈的操作，每一个栈帧中分配多少内存是在类结构确定下来时就已知的，因此这几个区域的内存分配和回收具备确定性，当方法结束或者线程结束时，内存自然就随着回收。而Java堆和方法区不一样，我们只有在程序出于运行期间才知道会创建哪些对象，这部分内存区域的分配回收都是动态的，所以GC所关注的是这部分内存。

对象存活

1.引用计数算法：
很多判断对象存活的方法是这样的：给对象中添加一个引用计数器，每当有一个地方应用它时，计数器值加1；当引用失效时，计数器值减1；任何时刻计数器的值为0的对象就是不可能在被使用的。客观的说，引用计数算法实现简单，判断效率也很高，但是它很难解决对象之间相互循环引用的问题。
下面代码显示了objA和objB互相引用，实际上这两个对象不可能再被访问，但是引用计数不为0。

package com.gc;/** 1. testGC()方法执行后，objA和objB会不会被GC呢？  2. @author zzm */public class ReferenceCountingGC {    public Object instance = null;    private static final int _1MB = 1024 * 1024;    /**     * 这个成员属性的唯一意义就是占点内存，以便在能在GC日志中看清楚是否有回收过     */    private byte[] bigSize = new byte[2 * _1MB];    public static void main(String[] args) {        ReferenceCountingGC objA = new ReferenceCountingGC();        ReferenceCountingGC objB = new ReferenceCountingGC();        objA.instance = objB;        objB.instance = objA;        objA = null;        objB = null;        // 假设在这行发生GC，objA和objB是否能被回收？        System.gc();    }}

运行结果显示，GC日志中包含“4603K->210K”，意味着虚拟机并没有因为这两个对象互相引用就不回收他们，也从侧面说明了虚拟机不是通过引用计数器算法判断对象是否存活的。

2. 可达性分析算法
这个算法的思路就是通过一系列的称为“GC Roots”的对象作为起始点，从这些节点开始向下搜索，搜索走过的路被称为“引用链”，当一个对象到GC Roots没有任何引用链时，则证明此对象不可用。
在Java语言中，可作为GC Roots的对象包括下面几种：
▪虚拟机栈中（栈帧中的本地变量表）的引用对象
▪方法区中类的静态属性引用的对象
▪方法区中常量引用的对象
▪本地方法栈中（Native方法）引用的对象

3.引用
无论是引用计数器算法的引用数量还是可达性分析算法判断对象的引用链是否可达，判断对象是否存活都与“引用”相关。在JDK1.2以前，Java的引用定义很传统：如果reference类型的数据中存储的数值代表的是另一块内存的起始地址，就称这块内存代表着一个引用。这种定义很纯粹，但太过狭隘。我们希望能描述这样一类对象：当内存空间足够时，则保留在内存中；如果内存空间经过垃圾收集之后内存还非常紧张，则可以抛弃这些对象，很多系统的缓存功能都符合这样的应用情景。
在JDK1.2之后，Java对引用的概念进行扩充，将引用分为强引用（Strong Reference）、软引用（Soft Reference）、弱引用（Weak Reference）、虚引用（Phantom Reference）4种，引用强度依次减弱。

■强引用就是指在代码中普遍存在的，类似“Object obj = new Object()”这类的引用，只要强引用还存在，GC永远不会回收掉被引用的对象。
■软引用用来描述一些还有用但并非必须的对象。对于软引用关联的对象，系统在将要发生内存溢出之前，将会把这些对象列进回收范围之内进行二次回收，如果这次回收还没有足够的内存，才会抛出内存溢出异常。在JDK1.2之后，提供了SoftReference类来实现软引用。
■弱引用引来描述非必需对象，当GC工作时，不论内存是否足够，都会回收被弱引用关联的的对象。在JDK1.2之后，提供了WeakReference类来实现弱引用。
■虚引用是最弱的一种引用关系，一个对象是否有虚引用的存在，完全不会对其生存时间构成影响，也无法通过虚引用来取得一个对象的实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收的时候收到一条系统通知。在JDK1.2之后，提供了PhantomReference类来实现虚引用。

4.生存还是死亡
即使在，可达性分析算法中不可达的对象，也并非”非死不可“的，真正宣告一个对象死亡，至少要经历两次标记过程:如果对象在可达性分析没有发现与GC Roots相连接的引用链，那么他会被第一次进行标记，并进行一次筛选，筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法，或者finalize()方法已经被虚拟机调用过，虚拟机将这两种情况都视为”没有必要执行“。
如果这个对象被判定为有必要执行finalize()方法，那么这个对象会放到一个队列之中，并在稍后一个有虚拟器自动建立的、低优先级的线程去执行它。这里所谓的执行是指虚拟机会触发这个方法，但并不承诺会等待它运行结束，finalize()方法是对象逃脱死亡的最后一次机会，稍后垃圾回收器会对该对象进行第二次小规模的标记，如果对象在finalize()方法中，成功拯救自己——只要与引用链上的任何一个对象建立关联即可，比如把自己（this关键字）赋值给某个类变量或者对象的成员变量，那么在第二次标记时，它将会被移出即将回收的集合，如果对象这时候还没有逃脱那基本上他就要被真的回收了。

package com.gc;/** * 此代码演示了两点：  * 1.对象可以在被GC时自我拯救。  * 2.这种自救的机会只有一次，因为一个对象的finalize()方法最多只会被系统自动调用一次 * @author zzm */public class FinalizeEscapeGC {    public static FinalizeEscapeGC SAVE_HOOK = null;    public void isAlive() {        System.out.println("yes, i am still alive :)");    }    @Override    protected void finalize() throws Throwable {        super.finalize();        System.out.println("finalize mehtod executed!");        FinalizeEscapeGC.SAVE_HOOK = this;    }    public static void main(String[] args) throws Throwable {        SAVE_HOOK = new FinalizeEscapeGC();        //对象第一次成功拯救自己        SAVE_HOOK = null;        System.gc();        // 因为Finalizer方法优先级很低，暂停0.5秒，以等待它        Thread.sleep(500);        if (SAVE_HOOK != null) {            SAVE_HOOK.isAlive();        } else {            System.out.println("no, i am dead :(");        }        // 下面这段代码与上面的完全相同，但是这次自救却失败了        SAVE_HOOK = null;        System.gc();        // 因为Finalizer方法优先级很低，暂停0.5秒，以等待它        Thread.sleep(500);        if (SAVE_HOOK != null) {            SAVE_HOOK.isAlive();        } else {            System.out.println("no, i am dead :(");        }    }}

5.回收方法区
永久带的垃圾收集，主要分为两个部分内容：废弃常量和无用的类。回收废弃常量与回收Java堆中的对象非常类似。例如一个字符串”abc”已经进入了常量池中，但是当前系统中没有任何一个对象叫做”abc”的，换句话说，就是没有任何String对象引用常量池中的”abc”常量，如果这时发生的内存回收而且必要的话，这个”abc”常量就会被系统清理出常量池。
判断一个常量是否是废弃常量比较简单，而判断一个类是否是无用的类相对严苛很多，类需要同时满足下面三个条件才能算是无用的类：
■该类所有的实例都被回收也就是在Java堆中不存在该类的任何实例。
■加载该类的ClassLoader已经被回收。
■该类对应的java.lang.Class对象没有在任何地方被引用，无法再任何地方通过反射访问到该类的方法。

垃圾收集算法

1.标记—清除算法
最基础的收集算法是标记—清除（Mark-Sweep）算法，算法分为“标记”和“清除”两个阶段：首先标记出所有需要回收的对象，在标记完成后统一回收所有被标记的对象，对象的标记判定在上面已经讲过了。该算法主要有两个不足：一个是效率问题，标记和清除的两个过程的效率都不高；另一个是空间问题，标记清除之后会产生大量不连续的内存碎片，空间碎片太多可能会导致以后程序在运行过程中分配大的对象时，无法找到足够的内存空间而不得不提前触发另一次垃圾收集动作。
2.复制算法
为了解决效率的问题，复制收集算法出现了，它是将可用的内存容量划分为大小相等的两块，每次只使用其中的一块，当着一块内存用完了，就将还存活的对象复制到另一块上面，然后再把已使用过的内存清理掉。这样使得每次是对整个半区进行内存回收，内存分配时也就不用考虑内存碎片等复杂情况，只要移动堆顶指针，按顺序分配内存即可，实现简单，运行高效。这种算法的代价是将内存压缩到原来的一半。
现在商业虚拟机就是采用这种收集算法来回收新生代，IBM专门研究表明，新生代中的对象“98%”是“朝生夕死”，并不需要按照1:1来划分内存，而是将内存空间分为一块大的Eden空间和两块较小的Survivor空间，每次使用Eden空间和一块Survivor空间，当回收时，将Eden和Survivor中还存活的对象一次性地复制到另外一块Survivor空间上，最后清理掉Eden和使用过的Survivor空间。HotSpot虚拟机默认Eden和Survivor大小比例是8:1,也就是每次新生代中可用的内存空间是整个新生代容量的90%，只有10%的内存空间会被浪费掉。每次回收，我们没办法保证都只有不超过10%的对象存活，当Survivor空间不够用时，需要依赖其他内存（这里指老年代）进行分配担保。
3.标记-整理算法
复制收集算法在对象存活率较高时，就需要进行较多的复制操作，效率将会变低。更关键的是，如果不想浪费50%的空间，就需要有额外的空间进行分配担保，所以在老年代一般不能直接选用这种算法。
根据老年代的特点，有人提出了另外一种“标记-整理”算法，标记过程，仍然与“标记-清除”算法一样，但后续步骤不是直接对可回收的对象进行整理，而是让所有存活的对象都向一端移动，然后直接清理掉边界以外的内存。
4.分代收集算法
当前商业虚拟机的垃圾收集都采用分代收集的算法，这种算法并没有什么新的思想，只是根据对象存活周期的不同，将内存划分为几块。一般是把Java堆分为新生代和老年代，这样就可以根据各个年代的特点，采用最适当的时候计算法。在新生代中，每次垃圾收集时都会发现有大量对象死去，只有少量存活，那就选用复制算法，只需要付出少量存活对象的复制成本就可以完成收集。而老年代中，因为对象存活率高，没有额外空间对他进行分配担保，就必须使用“标记-清理”或者“标记-整理”算法来进行回收。

本文内容主要是本人学习周志明老师的《深入理解Java虚拟机》一书的学习笔记，仅作学习巩固整理知识点使用，不作他用，在此感谢周老师。

0 0