java常量池

来源:互联网 发布:第一p2p软件 编辑:程序博客网 时间:2024/05/24 04:11
 java常量池是一个经久不衰的话题,也是面试官的最爱,题目花样百出,小菜早就对常量池有所耳闻,这次好好总结一下。

 

理论

     

     小菜先拙劣的表达一下jvm虚拟内存分布:

jvm虚拟内存分布

 

     程序计数器是jvm执行程序的流水线,存放一些跳转指令,这个太高深,小菜不懂。

     本地方法栈是jvm调用操作系统方法所使用的栈。

     虚拟机栈是jvm执行java代码所使用的栈。

     方法区存放了一些常量、静态变量、类信息等,可以理解成class文件在内存中的存放位置。

     虚拟机堆是jvm执行java代码所使用的堆。

     Java中的常量池,实际上分为两种形态:静态常量池运行时常量池

     所谓静态常量池,即*.class文件中的常量池,class文件中的常量池不仅仅包含字符串(数字)字面量,还包含类、方法的信息,占用class文件绝大部分空间。class文件常量池主要存放两大类常量,字面量(Literal)和符号引用量(Symbolic References),字面量相当于Java语言层面常量的概念,如文本字符串,代码中所定义的各种基本类型(如int、long等等)和对象型(如String及数组)的常量值;符号引用则属于编译原理方面的概念,包括了如下三种类型的常量:(1)类和接口的全限定名(2)字段名称和描述符(3)方法名称和描述符。(其中字段名称指的是类或接口的实例变量或类变量,字段的描述符是一个指示字段的类型的字符串。如在一个类中有以下形式的声明:A a = null, 则a为字段名,A为字段描述符。方法的描述符也是个字符串,该字符串指示了方法的返回值和参数的数量、顺序和类型。)

     而运行时常量池,则是jvm虚拟机在完成类装载操作后,将class文件中的常量池载入到内存中,并保存在方法区中,我们常说的常量池,就是指方法区中的运行时常量池。

(运行时常量池相对于CLass文件常量池的另外一个重要特征是具备动态性,Java语言并不要求常量一定只有编译期才能产生,也就是并非预置入CLass文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用比较多的就是String类的intern()方法。)

    常量池的好处:
   常量池是为了避免频繁的创建和销毁对象而影响系统性能,其实现了对象的共享。
   例如字符串常量池,在编译阶段就把所有的字符串文字放到一个常量池中。
  (1)节省内存空间:常量池中所有相同的字符串常量被合并,只占用一个空间。
  (2)节省运行时间:比较字符串时,==比equals()快。对于两个引用变量,只用==判断引用是否相等,也就可以判断实际值是否相等

java中基本类型的包装类的大部分都实现了常量池技术,即Byte,Short,Integer,Long,Character,Boolean;这几种包装类默认创建了数值[-128,127]的相应类型的缓存数据,但是超出此范围仍然会去创建新的对象。两种浮点数类型的包装类Float,Double并没有实现常量池技术。

     接下来我们引用一些网络上流行的常量池例子,然后借以讲解。

复制代码
 1 String s1 = "Hello"; 2 String s2 = "Hello"; 3 String s3 = "Hel" + "lo"; 4 String s4 = "Hel" + new String("lo"); 5 String s5 = new String("Hello"); 6 String s6 = s5.intern(); 7 String s7 = "H"; 8 String s8 = "ello"; 9 String s9 = s7 + s8;10           11 System.out.println(s1 == s2);  // true12 System.out.println(s1 == s3);  // true13 System.out.println(s1 == s4);  // false14 System.out.println(s1 == s9);  // false15 System.out.println(s4 == s5);  // false16 System.out.println(s1 == s6);  // true
复制代码

     首先说明一点,在java 中,直接使用==操作符,比较的是两个字符串的引用地址,并不是比较内容,比较内容请用String.equals()。

     s1 == s2这个非常好理解,s1、s2在赋值时,均使用的字符串字面量,说白话点,就是直接把字符串写死,在编译期间,这种字面量会直接放入class文件的常量池中,从而实现复用,载入运行时常量池后,s1、s2指向的是同一个内存地址,所以相等。

     s1 == s3这个地方有个坑,s3虽然是动态拼接出来的字符串,但是所有参与拼接的部分都是已知的字面量,在编译期间,这种拼接会被优化,编译器直接帮你拼好,因此String s3 = "Hel" + "lo";在class文件中被优化成String s3 = "Hello";,所以s1 == s3成立。

     s1 == s4当然不相等,s4虽然也是拼接出来的,但new String("lo")这部分不是已知字面量,是一个不可预料的部分,编译器不会优化,必须等到运行时才可以确定结果,结合字符串不变定理,鬼知道s4被分配到哪去了,所以地址肯定不同。配上一张简图理清思路:

java字符串不变     s1 == s9也不相等,道理差不多,虽然s7、s8在赋值的时候使用的字符串字面量,但是拼接成s9的时候,s7、s8作为两个变量,都是不可预料的,编译器毕竟是编译器,不可能当解释器用,所以不做优化,等到运行时,s7、s8拼接成的新字符串,在堆中地址不确定,不可能与方法区常量池中的s1地址相同。(解释:局部变量s7,s8存储的是存储两个拘留字符串对象(intern字符串对象)的地址,运行期JVM首先会在堆中创建一个StringBuilder类,同时用s7指向的拘留字符串对象完成初始化,然后调用append方法完成对s8所指向的拘留字符串的合并,接着调用StringBuilder的toString()方法在堆中创建一个String对象.最后将刚生成的String对象的堆地址存放在局部变量s9中。String str = “This is only a” + “ simple” + “ test”;相当于 StringBuffer builder = new StringBuilder(“This is only a”).append(“ simple”).append(“ test”);
jvm常量池,堆,栈内存分布

     s4 == s5已经不用解释了,绝对不相等,二者都在堆中,但地址不同。

     s1 == s6这两个相等完全归功于intern方法,s5在堆中,内容为Hello ,intern方法会尝试将Hello字符串添加到常量池中,并返回其在常量池中的地址,因为常量池中已经有了Hello字符串,所以intern方法直接返回地址;而s1在编译期就已经指向常量池了,因此s1和s6指向同一地址,相等。

     至此,我们可以得出三个非常重要的结论:

 

           必须要关注编译期的行为,才能更好的理解常量池。

           运行时常量池中的常量,基本来源于各个class文件中的常量池。

           程序运行时,除非手动向常量池中添加常量(比如调用intern方法),否则jvm不会自动添加常量到常量池。

 

     以上所讲仅涉及字符串常量池,实际上还有整型常量池、浮点型常量池等等,但都大同小异,只不过数值类型的常量池不可以手动添加常量,程序启动时常量池中的常量就已经确定了,比如整型常量池中的常量范围:-128~127,只有这个范围的数字可以用到常量池。

    再看一下Integer的特别例子:

Integer i1 = 40;Integer i2 = 40;Integer i3 = 0;Integer i4 = new Integer(40);Integer i5 = new Integer(40);Integer i6 = new Integer(0);System.out.println("i1=i2   " + (i1 == i2));System.out.println("i1=i2+i3   " + (i1 == i2 + i3));System.out.println("i1=i4   " + (i1 == i4));System.out.println("i4=i5   " + (i4 == i5));System.out.println("i4=i5+i6   " + (i4 == i5 + i6));   System.out.println("40=i5+i6   " + (40 == i5 + i6));
i1=i2   truei1=i2+i3   truei1=i4   falsei4=i5   falsei4=i5+i6   true40=i5+i6   true

解释:语句i4 == i5 + i6,因为+这个操作符不适用于Integer对象,首先i5和i6进行自动拆箱操作,进行数值相加,即i4 == 40。然后Integer对象无法与数值进行直接比较,所以i4自动拆箱转为int值40,最终这条语句转为40 == 40进行数值比较。
Java中的自动装箱与拆箱



作者:梦工厂
链接:http://www.jianshu.com/p/c7f47de2ee80
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

实践

     

     说了这么多理论,接下来让我们触摸一下真正的常量池。

     前文提到过,class文件中存在一个静态常量池,这个常量池是由编译器生成的,用来存储java源文件中的字面量(本文仅仅关注字面量),假设我们有如下java代码:

 

1 String s = "hi";

 

     为了方便起见,就这么简单,没错!将代码编译成class文件后,用winhex打开二进制格式的class文件。如图:

 二进制格式的class文件

 

     简单讲解一下class文件的结构,开头的4个字节是class文件魔数,用来标识这是一个class文件,说白话点就是文件头,既:CA FE BA BE。

     紧接着4个字节是java的版本号,这里的版本号是34,因为笔者是用jdk8编译的,版本号的高低和jdk版本的高低相对应,高版本可以兼容低版本,但低版本无法执行高版本。所以,如果哪天读者想知道别人的class文件是用什么jdk版本编译的,就可以看这4个字节。

     接下来就是常量池入口,入口处用2个字节标识常量池常量数量,本例中数值为00 1A,翻译成十进制是26,也就是有25个常量,其中第0个常量是特殊值,所以只有25个常量。

     常量池中存放了各种类型的常量,他们都有自己的类型,并且都有自己的存储规范,本文只关注字符串常量,字符串常量以01开头(1个字节),接着用2个字节记录字符串长度,然后就是字符串实际内容。本例中为:01 00 02 68 69。

     接下来再说说运行时常量池,由于运行时常量池在方法区中,我们可以通过jvm参数:-XX:PermSize、-XX:MaxPermSize来设置方法区大小,从而间接限制常量池大小。

     假设jvm启动参数为:-XX:PermSize=2M -XX:MaxPermSize=2M,然后运行如下代码:

复制代码
1 //保持引用,防止自动垃圾回收2 List<String> list = new ArrayList<String>();3         4 int i = 0;5         6 while(true){7     //通过intern方法向常量池中手动添加常量8     list.add(String.valueOf(i++).intern());9 }
复制代码

     程序立刻会抛出:Exception in thread "main" java.lang.outOfMemoryError: PermGen space异常。PermGen space正是方法区,足以说明常量池在方法区中。

     在jdk8中,移除了方法区,转而用Metaspace区域替代,所以我们需要使用新的jvm参数:-XX:MaxMetaspaceSize=2M,依然运行如上代码,抛出:java.lang.OutOfMemoryError: Metaspace异常。同理说明运行时常量池是划分在Metaspace区域中。具体关于Metaspace区域的知识,请读者自行搜索。

     本文所有代码均在jdk7、jdk8下测试通过,其他版本jdk可能会略有差异,请读者自行探索。

参考: <http://www.cnblogs.com/iyangyuan/p/4631696.html>     http://www.jianshu.com/p/c7f47de2ee80

     参考文献:《深入理解java虚拟机———jvm高级特性与最佳实践》

原创粉丝点击