Java垃圾回收

来源：互联网发布：手机qq2010 java版编辑：程序博客网时间：2024/05/17 18:12

概述：

说起垃圾收集，大部分人都把这项技术当做Java语言的伴生产物。事实上，GC的历史比Java久远，1960年诞生于MIT的Lisp是第一门真正使用内存动态分配和垃圾收集技术的语言。GC需要完成的三件事情：

1 哪些内存需要回收

2 什么时候回收

3 如何回收

1.1 对象生死的判定

在堆里面存放着Java世界中几乎所有的对象实例，垃圾收集器在对堆进行回收前，第一件事就是要确定这些对象哪些是存活的，哪些是死去的。主要有两种算法进行判断：一种是引用计数法，另一种是可达性分析算法

1.1.1 引用计数算法

给对象中添加一个引用计数器，当这个引用被引用时，应用计数器就加一，当这个引用失效时，这个计数器就减一，当这个计数器为零时，就表示这个引用不会再被引用，可以被回收。

1.1.2 可达性分析算法

这个算法的的基本思想就是通过一系列GC Roots的对象作为起始点，从这些起始点向下搜索，搜索所走过的路径成为引用链，当一个对象到GC Roots之间没有引用链的时候，则证明该对象是不可用的，可以回收。在主流的商用语言（Java C# 甚至前面提到的Lisp）的主流实现中，都是通过可达性分析来判定对象是否存活的。

在Java语言中作为GC Roots的对象包括下面几种

1. 虚拟机栈中引用的对象

2. 方法区中类静态引用的对象

3. 方法区中常亮引用的对象

4. 本地方法栈中JNI引用的对象

1.2 再谈引用

无论是通过引用计数算法判断对象的引用数量，还是通过可达性分析算法判断对象的引用链是否可达，判定对象是存活都与引用有关。再JDK1.2以前，Java中的引用的定义很传统：如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址，就称为这块内存代表着一个引用。这种定义很纯粹，但是太过狭隘，一个对象在这种定义下只有引用或者没有被引用两种状态，对于如何描述一些食之无味，弃之可惜的对象就显得无能为力。我们希望能描述这样的一类对象：当内存还足够的时，则能保留在内存之中；如果内存空间在进行垃圾回收后还是非常紧张，则可以抛弃这些对象。

在JDK1.2之后，Java对引用的概念进行了扩充，将引用分为强引用，弱引用，软引用，虚引用。

强引用：就是指在程序代码之中普遍存在的类似Object o = new Object（）这类的引用，只要强引用还存在，垃圾收集器就不会回收掉引用的对象

软引用：是用来描述一些还有用但并非必须的对象。对于软引用关联着的对象，在系统将要发生内存溢出异常之前，将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存，才会抛出内存溢出异常。

弱引用：用来描述非必须对象，但是他的强度比软引用更弱一些，被弱引用关联的对象只能生存到下一次垃圾收集之前。当垃圾收集器工作时，无论当前内存是否足够，都会回收掉只被弱引用关联的对象。

虚引用：也被称为幽灵引用或者幻影引用，它是最弱的一种引用关系。一个对象是否有虚引用存在，完全不会对其生存时间构成影响，也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知

1.3 生存还是死亡

及时再可达性分析算法中不可达的对象，也并非就是非死不可的，这个时候它们暂时处于缓刑阶段，要真正的宣告死亡，至少要经历两次标记过程：如果对象在进行可达性分析后发现没有与GC Roots相关联的引用链，那它将被第一次标记并且进行一次筛选，筛选的条件是对象是否有必要执行finalize（）方法。当对象没有覆盖finalize（）方法，或者finalize（）方法已经被虚拟机调用过，虚拟机将这两种情况都视为没有必要执行finalize（）

1.4 回收方法区

很多人认为方法区是没有垃圾收集的，Java虚拟机规范中确实说过可以不要求虚拟机在方法区实现垃圾收集，而且在方法区就进行垃圾收集的性价比一般比较低：在堆中，尤其在新生代中，常规应用进行一次垃圾收集一般可以回收70%~95%的空间，而永久代的垃圾收集效率远低于此。

永久代的垃圾收集主要回收两部分内容：废弃的常量和无用的类。回收废弃常量跟Java 堆中相类似。

如何判断无用类？

1.该类所有的实例都被回收，也就是Java堆中不存在该类的任何实例

2.加载该类的ClassLoader已经被回收

3.该类队形的java.lang.Class对象没有任何地方被引用，无法再任何地方通过反射访问该类的方法

1.5 垃圾收集算法

垃圾收集算法有：标记-清除算法、复制算法、标记整理算法、分代收集算法。

标记-清除算法：算法分为标记和清除两个阶段：首先标记出需要回收的对象，在标记完成后统一回收所有被标记的对象。（它的标记就是通过引用计数算法和可达性分析算法）。这种算法主要有两种不足：一种是效率问题，标记和清除两个过程的效率不高：另一种是空间问题，在标记清除之后会产生大量的不连续内存碎片，空间碎片太多可能会导致以后再程序运行过程中需要分配较大对象时，无法找到足够的连续内存而不得不提前出发另一次垃圾回收动作。

复制算法：它将可用的内存平均分成大小相等的两块，每次只使用其中的一块，。当这块内存用完了，就将还存活的对象复制到另外一块上面，然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收，内存分配时也就不用考虑内存碎片等复杂情况，只要移动堆定的指针，按顺序分配内存即可，实现简单，运行高效。这是这种算法的代价是将内存缩小为了原来的一半，未免太高。

标记-整理算法：标记过程仍然和标记-清除算法一样，但后续步骤不是直接对回收对象进行清理，而是让所有存活的对象都向一端移动，然后直接清理掉端边的内存。

分代收集算法：就是把Java堆分为新生代和老年代，对于新生代中每次垃圾收集时都发现有大批对象死去，只有少量存活，那就选用复制算法，只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保，就必须使用标记-清除或者是标记整理算法进行回收。

阅读全文

0 0