String -> JVM理解

来源:互联网 发布:json数组没有key 编辑:程序博客网 时间:2024/06/03 10:28

1. 首先String不属于8种基本数据类型,String是一个对象。
因为对象的默认值是null,所以String的默认值也是null;但它又是一种特殊的对象,有其它对象没有的一些特性 .

2. new String()和new String(“”)都是申明一个新的空字符串,是空串不是null;

3. String str=”kvill”;
String str=new String (“kvill”);的区别:
在这里,我们不谈堆,也不谈栈,只先简单引入常量池这个简单的概念。
常量池(constant pool)指的是在编译期被确定,并被保存在已编译的.class文件中的一些数据。它包括了关于类、方法、接口等中的常量,也包括字符串常量。
例子1:

        String s0="kvill"
        String s1
="kvill"
        String s2
="kv" + "ill"
        System.out.println( s0
==s1 ); 
        System.out.println( s0
==s2 );
结果:
s0==s1 true
s0
==s2 true


首先,我们要知结果为道Java会确保一个字符串常量只有一个拷贝。
因为例子中的s0和s1中的”kvill”都是字符串常量, 它们在编译期就被确定了,所以s0==s1为true;而”kv”和”ill”也都是字符串常量,当一个字符串由多个字符串常量连接而成时,它自己肯定也 是字符串常量,所以s2也同样在编译期就被解析为一个字符串常量,所以s2也是常量池中”kvill”的一个引用。
所以我们得出s0==s1==s2;

用new String() 创建的字符串不是常量,不能在编译期就确定,所以new String() 创建的字符串不放入常量池中,它们有自己的地址空间。
看例2:

        String s0="kvill"
        String s1
=new String("kvill"); 
        String s2
="kv" + new String("ill"); 
        System.out.println( 
"s0==s1 "+ (s0==s1) ); 
        System.out.println( 
"s0==s2 "+ (s0==s2) ); 
        System.out.println( 
"s1==s2 "+ (s1==s2));

结果:

s0==s1 false
s0
==s2 false
s1
==s2 false

例2中s0还是常量池中”kvill”的应用,s1因为无法在编译期确定,所以是运行时创建的新对象”kvill”的引用,s2因为有后半部分 new String(“ill”)所以也无法在编译期确定,所以也是一个新创建对象”kvill”的应用;明白了这些也就知道为何得出此结果了.

4. String.intern():
再补充介绍一点:存在于.class文件中的常量池,在运行期被JVM装载,并且可以扩充。 String的intern()方法就是扩充常量池的一个方法;当一个String实例str调用intern()方法时,Java查找常量池中是否有相 同Unicode的字符串常量,如果有,则返回其的引用,如果没有,则在常量池中增加一个Unicode等于str的字符串并返回它的引用;看例3就清楚 了
例3:

        String s0= "kvill"
        String s1
=new String("kvill"); 
        String s2
=new String("kvill"); 
        System.out.println( s0
==s1 ); 
        System.out.println( 
"**********" ); 
        s1.intern(); 
        s2
=s2.intern(); //把常量池中"kvill"的引用赋给s2 
        System.out.println( s0==s1); 
        System.out.println( s0
==s1.intern() ); 
        System.out.println( s0
==s2 ); 

结果:

false 
********** 
false //虽然执行了s1.intern(),但它的返回值没有赋给s1 
true //说明s1.intern()返回的是常量池中”kvill”的引用 
true 

最后我再破除一个错误的理解:
有人说,“使用String.intern()方法则可以将一个String类的保存到一个全局 String表中,如果具有相同值的Unicode字符串已经在这个表中,那么该方法返回表中已有字符串的地址,如果在表中没有相同值的字符串,则将自己 的地址注册到表中“如果我把他说的这个全局的String表理解为常量池的话,他的最后一句话,“如果在表中没有相同值的字符串,则将自己的地址注册到表中”是错的:

 

String s1=new String("kvill"); 
String s2
=
s1.intern(); 
System.out.println( s1
==
s1.intern() ); 
System.out.println( s1
+" "+
s2 ); 
System.out.println( s2
==s1.intern() ); 

 

false 
kvill kvill 
true 
在这个类中我们没有声名一个”kvill”常量,所以常量池中一开始是没有”kvill”的,当我们调用s1.intern()后就在常量池中新添加了一个”kvill”常量,原来的不在常量池中的”kvill”仍然存在,也就不是“将自己的地址注册到常量池中”了。
s1==s1.intern()为false说明原来的“kvill”仍然存在;
s2现在为常量池中“kvill”的地址,所以有s2==s1.intern()为true。
5. 关于equals()和==:
这个对于String简单来说就是比较两字符串的Unicode序列是否相当,如果相等返回true;而==是比较两字符串的地址是否相同,也就是是否是同一个字符串的引用。
6. 关于String是不可变的
这一说又要说很多,大家只要知道String的实例一旦生成就不会再改变了,比如说:String str=”kv”+”ill”+” “+”ans”;
就 是有4个字符串常量,首先”kv”和”ill”生成了”kvill”存在内存中,然后”kvill”又和” “ 生成 ”kvill “存在内存中,最后又和生成了”kvill ans”;并把这个字符串的地址赋给了str,就是因为String的“不可变”产生了很多临时变量,这也就是为什么建议用StringBuffer的原 因了,因为StringBuffer是可改变的。

java程序内存主要分为了2个部分,包括 stack segment(栈内存区)、heap segment(堆内存区)。

    在分析Java程序内存分配情况时,我们从下面这个经常被使用的例子开始吧。
    下面程序将打印什么呢?
   
Java代码  收藏代码
  1. String s1 = new String("abc");  
  2. String s2 = new String("abc");  
  3. System.out.print(s1.equals(s2)); // 1  
  4. System.out.print(s1 == s2); // 2  

    可能大家心中已经有答案了,第1条语句打印的是true,第二条语句打印的false,没错,正如大家所想,打印结果就是这样。那么,大家是否知道为什么第2条语句打印的是false呢?让我们来看看这个程序中的数据在内存中分配的情况吧。

    首先,我们分析第一条语句String s1=new String("abc");
    其实这条语句是下面两条语句的缩写,
    String s1; //1
    s1=new String(“abc”); //2
    1. 在栈内存中定义一个名为s1的对String类的对像引用变量
    2. 在堆内存开辟了一块空间用于存放字符串“abc”,将1定义的引用变量s1指向该空间。
    同理,第二条语句String s2=new String("abc");也做了同样的事情,定义引用变量,指向新开辟出来的空间。说到这里大家可能心中已经有答案了,为什么s1!=s2呢?因为它们指向的是两块不同的堆内存空间。

    其实,在java中new过程分配内存情况都和上面类似,先在栈内存中定义引用,然后在堆内存中开辟空间,存放数据,最后让引用指向该空间,如果一个引用 没有指向任何空间,那么在使用这个引用变量时,程序将抛出著名的NullPointerException,其实从这个异常名字我们也能清晰知道产生该异 常的原因,不是吗?

    熟悉了上面这个例子,基本上大家对Java程序内存分配情况,已经入门了,让我们进入下一步吧。
    我们定义下面的一个类:
   
Java代码  收藏代码
  1. public class Cat {  
  2.     private double weight;  
  3.     private int age;  
  4.   
  5.     public Cat(double _weight, int _age) {  
  6.         this.weight = _weight;  
  7.         this.age = _age;  
  8.     }  
  9.   
  10.     //get set 方法...  
  11. }  

    我们可能在其他程序中new出一只猫来,像这样:
   
Java代码  收藏代码
  1. public class Demo{  
  2. public static void main(String[] args){  
  3. Cat kitty=new Cat(3.0,2);  
  4. }  
  5. }  

    那么这个new过程是怎么进行的呢?
    按照上面对String类型new的分析,大家可能想,这个简单,先在栈内存中定义引用变量kitty,然后在堆内存中分配一块空间,将kitty猫的属性存放进去,最后让引用变量指向这个空间,完了。
    对,大家这样分析大体是正确的,但大家好像忽略了一个重要的细节,kitty猫的属性是怎样存进堆内存空间的呢?
    我们来看看Cat这个类的构造函数吧,它定义了两个形参,也就是局部变量,在我们试图通过new向它传实参值时,在栈内存中定义了两个引用变 量,_weight,_age并赋值,即两个引用变量所在栈内存中内容分别为3.0,2,同时在堆中开辟了一块新空间,空间中有两个内存区域,而内存中内 容为系统初始化内容。然后通过构造函数将栈内存中值赋给堆内存中值,就这样堆内存中新空间就被赋值了,接下来就像大家所想的那样将引用kitty指向这块 新空间。大家可能会想,那么栈中分配出来的那两块内存怎么处理呢?
    其实,做完上面的事情后,局部变量将从栈中弹出,这个过程是自发的,它有别于JVM垃圾收集,JVM垃圾收集主要是用来释放堆内存空间,某块堆内存在没被引用,或引用它的变量再也不会被使用时将被回收。
   
    噢,好长的分析啊,不知道大家看得怎么样了,我们继续吧。

    假设在Demo类中有一个方法,像这样:
   
Java代码  收藏代码
  1. public void change(Cat _cat){  
  2.         _cat.setAge(5);  
  3.     }  

    那么把刚才new出来的 kitty传入该方法中,像这样:
   
Java代码  收藏代码
  1. Demo demo=new Demo();  
  2. Cat kitty=new Cat(3.0,2);  
  3. demo.change(kitty);  
  4. System.out.print(kitty.getAge());  

    程序将打印kitty的age,那么该age会变化吗?
    可能大家受到C语言中一个著名问题,也就是swap(交换)问题(见下面)的影响,得出了不会变的结论,也就是将打印2,但事实并非如此,该程序将打印5,那么到底发生了什么呢?让我们从程序内存变化情况,来解释这个现象吧。
    首先,按前面我们的分析,new出kitty猫时,在栈内存中定义了一个引用,指向堆中分配的内存,堆内存存放kitty猫的信息。
    然后,我们开始调用change方法了,在我们把kitty传给该方法时,在栈内存中就定义了局部变量_cat,该引用变量将被指向kitty所指向的堆内存区域,然后_cat对它指向的堆内存区域内容进行了更改,这不就是kitty所指堆内存区域被更改了吗?因为它们指向同一块堆内存。就这样,调用kitty.getAge()时,将得到5这样的结果。最后,分配出来的_cat将从栈中弹出。

    分析到这里,我们再回头看,swap(交换)问题
    我们都知道在C语言里有个方法像这样:
   
Java代码  收藏代码
  1. void swap(int a,int b){  
  2.     int temp=a;  
  3.     int a=b;  
  4.     int b=temp;  
  5. }  

    然后在主函数中使用它,像这样:
   
Java代码  收藏代码
  1. int a=2;  
  2. int b=5;  
  3. swap(a,b);  

    我们都知道这是无法交换a,b的值的,可是大家是否还记得解决方法呢,怎么解决这个问题呢?在C语言中我们用指针,像这样:
   
Java代码  收藏代码
  1. void swap(int *a,int *a){  
  2. int temp=*a;  
  3. *a=*b;  
  4. *b=temp;  
  5. }  
  6. main(){  
  7. int a=2;  
  8. int b=5;  
  9. swap(&a,&b);  
  10. }  

    看到这里,大家可能想起来了,这里使用了引用。
说到这里,大家是不是豁然开朗了呢,在Java栈内存中存放的就是引用啊,所以Java虽然没有显式的指针,但处处是指针。
   
    好了,休息一下,我们再继续

    随着一步步深入,大家可能对Java程序内存分配情况有了大致的了解,那么让我们一起来谈谈更高级的主题吧。
在文章开头我们使用String类例子,大家是不是觉得有点别扭呢?是啊,可能大家定义String都是像下面这样直接定义的,但这样有什么不同呢?
   
Java代码  收藏代码
  1. String s1="abc";  
  2. String s2="abc";  
  3. System.out.print(s1.equals(s2)); // 1  
  4. System.out.print(s1==s2); // 2  

    显然,上面程序第1条打印语句,输出的是true,那么第二条呢?
    如果大家运行该程序,第2条打印的也是true,为什么呢?大家是不是有点迷糊了呢,好,让我们来分析一下这个程序内存分配情况吧。

    在这里我们先介绍一个高级概念:常量池
    JVM虚拟机为每个被装载的类型维护一个常量池。常量池就是该类型所用到常量的一个有序集和,包括直接常量(string,integer和 floating point常量)和对其他类型,字段和方法的符号引用。对于String常量,它的值是在常量池中的。而JVM中的常量池在内存当中是以表的形式存在的, 对于String类型,有一张固定长度的CONSTANT_String_info表用来存储文字字符串值,注意:该表只存储文字字符串值,不存储符号引 用。说到这里,对常量池中的字符串值的存储位置应该有一个比较明了的理解了。
    在介绍完JVM常量池的概念后,接着我们谈开始前面提到的“abc”的值的内存分布的位置。对“abc”的值,实际上是在class文件被JVM装载到内 存当中就已经为“abc”这个字符串在常量池的CONSTANT_String_info表中分配了空间来存储“abc”这个值。既然“abc”这个字符 串常量存储在常量池中,常量池是属于类型信息的一部分,类型信息也就是每一个被转载的类型,这个类型反映到JVM内存模型中是对应存在于JVM内存模型的 方法区中,也就是这个类型信息中的常量池是存在于在方法区中,方法区可以在一个堆中自由分配。
    这也就说明了为什么s1==s2,因为它们俩都是指向常量池中“abc”串的引用,而像文章开头里提到的new出来的String在新分配的堆内存中内容 “abc”,只是常量池中“abc”串的拷贝。所以,请大家不要用new方法来初始化String类型,直接赋值就可以了。

原创粉丝点击