通过反编译深入理解Java String及intern(笔记整理二)

来源:互联网 发布:青蛙寿命 知乎 编辑:程序博客网 时间:2024/05/22 00:15

主要是通过反编译 javap -v 命令 来看代码的执行


String是一个特殊的包装类数据。可以用:

String str = new String("abc");   

String str = "abc";

 

两种的形式来创建,第一种是用new()来新建对象的,它会在存放于堆中。每调用一次就会创建一个新的对象。而第二种是先在栈中创建一个对String类的对象引用变量str,然

后通过符号引用去字符串常量池里找有没有"abc",如果没有,则将"abc"存放进字符串常量池 ,并令str指向”abc”,如果已经有”abc”则直接令str指向“abc”

比较类里面的数值是否相等时,用equals()方法;当测试两个包装类的引用是否指向同一个对象时,用==,下面用例子说明上面的理论。

String str1 = "abc";   

String str2 = "abc";   

System.out.println(str1==str2); //true


可以看出str1str2是指向同一个对象的。

String str1 =new String ("abc");   

String str2 =new String ("abc");   

System.out.println(str1==str2); // false

 

new的方式是生成不同的对象。每一次生成一个。

因此用第二种方式创建多个”abc”字符串,在内存中 其实只存在一个对象而已.这种写法有利与节省内存空间.同时它可以在一定程度上提高程序的运行速度,因为JVM会自动根据

栈中数据的实际情况来决定是否有必要创建新对象。而对于String str = new String("abc");的代码,则一概在堆中创建新对象,而不管其字符串值是否相等,是否有必要创建新

对象,从而加重了程序的负担。

一方面, 要注意:我们在使用诸如String str = "abc";的格式定义类时,总是想当然地认为,创建了String类的对象str。担心陷阱!对象可能并没有被创建!而可能只是指向一

个先前已经创建的对象。只有通过new()方法才能保证每次都创建一个新的对象。
 
由于String类的immutable性质,当String变量需要经常变换 其值时,应该考虑使用StringBuffer类,以提高程序效率。
 
1. 首先String不属于8种基本数据类型,String是一个对象。因为对象的默认值是null,所以String的默认值也是null;但它又是一种特殊的对象,有其它对象没有的一些特性。

2. new String()new String(”")都是申明一个新的空字符串,是空串不是null

3. String str=”kvill”String str=new String (”kvill”)的区别

示例:

    String s0="kvill";   

    String s1="kvill";   

    String s2="kv" + "ill";   

    System.out.println( s0==s1 );   

    System.out.println( s0==s2 );  

 

结果为:

true 
true

首先,我们要知结果为道Java会确保一个字符串常量只有一个拷贝。

因为例子中的 s0s1中的”kvill”都是字符串常量,它们在编译期就被确定了,所以s0==s1true;而”kv””ill”也都是字符串常量,当一个字 符串由多个字符串常量连接而成

时,它自己肯定也是字符串常量,所以s2也同样在编译期就被解析为一个字符串常量,所以s2也是常量池中” kvill”的一个引用。所以我们得出s0==s1==s2;用new String()

建的字符串不是常量,不能在编译期就确定,所以new String()创建的字符串不放入常量池中,它们有自己的地址空间。

示例:

00001. String s0="kvill";   

00002. String s1=new String("kvill");   

00003. String s2="kv" + new String("ill");   

00004. System.out.println( s0==s1 );   

00005. System.out.println( s0==s2 );   

00006. System.out.println( s1==s2 ); 

结果为:

false 
false 
false

2s0还是常量池 中"kvill”的应用,s1因为无法在编译期确定,所以是运行时创建的新对象”kvill”的引用,s2因为有后半部分new String(”ill”)所以也无法在编译期确定,所以

也是一个新创建对象”kvill”的应用;明白了这些也就知道为何得出此结果了。

4. String.intern()

再补充介绍一点:存在于.class文件中的常量池,在运行期被JVM装载,并且可以扩充。Stringintern()方法就是扩充常量池的 一个方法;当一个String实例str调用intern()方法

时,Java 查找常量池中 是否有相同Unicode的字符串常量,如果有,则返回其的引用,如果没有,则在常 量池中增加一个Unicode等于str的字符串并返回它的引用;看示例就

清楚了

示例:

    String s0= "kvill";   

    String s1=new String("kvill");   

    String s2=new String("kvill");   

    System.out.println( s0==s1 );   

    System.out.println( "**********" );   

    s1.intern();   

    s2=s2.intern(); //把常量池中"kvill"的引用赋给s2   

    System.out.println( s0==s1);   

    System.out.println( s0==s1.intern() );   

    System.out.println( s0==s2 );  

 

结果为:

false 
false //虽然执行了s1.intern(),但它的返回值没有赋给s1 
true //说明s1.intern()返回的是常量池中"kvill"的引用 
true

最后我再破除一个错误的理解:有人说,使用String.intern() 方法则可以将一个String 类的保存到一个全局String 表中 ,如果具有相同值的Unicode 字符串已经在这个表中,

那么该方法返回表中已有字符串的地址,如果在表中没有相同值的字符串,则将自己的地址注册到表中如果我把他说的这个全局的String 表理解为常量池的话,他的最后一句

话,如果在表中没有相同值的字符串,则将自己的地址注册到表中是错的:

示例:

    String s1=new String("kvill");   

    String s2=s1.intern();   

    System.out.println( s1==s1.intern() );   

    System.out.println( s1+" "+s2 );   

    System.out.println( s2==s1.intern() );  

 

结果:

false 
kvill kvill 
true

在这个类中我们没有声名一个”kvill”常量,所以常量池中一开始是没有”kvill”的,当我们调用s1.intern()后就在常量池中新添加了一 个”kvill”常量,原来的不在常量池中的”kvill”

然存在,也就不是将自己的地址注册到常量池中了。

s1==s1.intern() false说明原来的”kvill”仍然存在;s2现在为常量池中”kvill”的地址,所以有s2==s1.intern()true

5. 关于equals()==:

这个对于String简单来说就是比较两字符串的Unicode序列是否相当,如果相等返回true;==是 比较两字符串的地址是否相同,也就是是否是同一个字符串的引用。

6. 关于String是不可变的

这一说又要说很多,大家只要知道String的实例一旦生成就不会再改变了,比如说:String str=”kv”+”ill”+” “+”ans”;就是有4个字符串常量,首先”kv””ill”生成了”kvill”存在内存

中,然后”kvill”又和” ”生成 “kvill “存在内存中,最后又和生成了”kvill ans”;并把这个字符串的地址赋给了str,就是因为String不可变产生了很多临时变量,这也就是为什么建议

StringBuffer的原 因了,因为StringBuffer是可改变的。

 

----------------

----------------

下面是一些String相关的常见问题:

String中的final用法和理解

final StringBuffer a = new StringBuffer("111");
final StringBuffer b = new StringBuffer("222");
a=b;//此句编译不通过
final StringBuffer a = new StringBuffer("111");
a.append("222");// 编译通过

可见,final只对引用的""(即内存地址)有效,它迫使引用只能指向初始指向的那个对象,改变它的指向会导致编译期错误。至于它所指向的对象 的变化,final是不负责的。

String常量池问题的几个例子

下面是几个常见例子的比较分析和理解:

    String a = "a1";   

    String b = "a" + 1;   

    System.out.println((a == b)); //result = true  

    String a = "atrue";   

    String b = "a" + "true";   

    System.out.println((a == b)); //result = true  

    String a = "a3.4";   

    String b = "a" + 3.4;   

    System.out.println((a == b)); //result = true


分析:JVM对于字符串常量的"+"号连接,将程序编译期,JVM就将常量字符串的"+"连接优化为连接后的值,拿"a" + 1来说,经编译器优化后在class中就已经是a1。在编译期其

字符串常量的值就确定下来,故上面程序最终的结果都为true

    String a = "ab";   

    String bb = "b";   

    String b = "a" + bb;   

    System.out.println((a == b)); //result = false


分析:JVM对于字符串引用,由于在字符串的"+"连接中,有字符串引用存在,而引用的值在程序编译期是无法确定的,即"a" + bb无法被编译器优化,只有在程序运行期来动态

分配并将连接后的新地址赋给b。所以上面程序的结果也就为false

    String a = "ab";   

    final String bb = "b";   

    String b = "a" + bb;   

    System.out.println((a == b)); //result = true


分析:和[3]中唯一不同的是bb字符串加了final修饰,对于final修饰的变量,它在编译时被解析为常量值的一个本地拷贝存储到自己的常量 池中或嵌入到它的字节码流中。所以

此时的"a" + bb"a" + "b"效果是一样的。故上面程序的结果为true

 

    String a = "ab";   

    final String bb = getBB();   

    String b = "a" + bb;   

    System.out.println((a == b)); //result = false   

    private static String getBB() {  

    return "b";   

    }

 

分析:JVM对于字符串引用bb,它的值在编译期无法确定,只有在程序运行期调用方法后,将方法的返回值和"a"来动态连接并分配地址为b,故上面 程序的结果为false

通过上面4个例子可以得出得知:

String  s  =  "a" + "b" + "c"; 
  
就等价于String s = "abc";  

String  a  =  "a";   
String  b  =  "b";   
String  c  =  "c";   
String  s  =   a  +  b  +  c; 

这个就不一样了,最终结果等于: 

    StringBuffer temp = new StringBuffer();     

    temp.append(a).append(b).append(c);     

    String s = temp.toString();


由上面的分析结果,可就不难推断出String采用连接运算符(+)效率低下原因分析,形如这样的代码:

    public class Test {  

    public static void main(String args[]) {  

    String s = null;  

    for(int i = 0; i < 100; i++) {  

    s += "a";  

    }  

    }  

    }

 

每做一次 + 就产生个StringBuilder对象,然后append后就扔掉。下次循环再到达时重新产生个StringBuilder对象,然后append 字符串,如此循环直至结束。如果我们直接采

StringBuilder对象进行 append的话,我们可以节省 N - 1次创建和销毁对象的时间。所以对于在循环中要进行字符串连接的应用,一般都是用StringBufferStringBulide

r对象来进行 append操作。

String对象的intern方法理解和分析:

    public class Test4 {  

    private static String a = "ab";   

    public static void main(String[] args){  

    String s1 = "a";  

    String s2 = "b";  

    String s = s1 + s2;  

    System.out.println(s == a);//false  

    System.out.println(s.intern() == a);//true    

    }  

    }

 

这里用到Java里面是一个常量池的问题。对于s1+s2操作,其实是在堆里面重新创建了一个新的对象,s保存的是这个新对象在堆空间的的内容,所 以sa的值是不相等的。而

当调用s.intern()方法,却可以返回s在常量池中的地址值,因为a的值存储在常量池中,故s.interna的值相等。

总结

栈中用来存放一些原始数据类型的局部变量数据和对象的引用(String,数组.对象等等)但不存放对象内容

堆中存放使用new关键字创建的对象.

字符串是一个特殊包装类,其引用是存放在栈里的,而对象内容必须根据创建方式不同定(常量池和堆).有的是编译期就已经创建好,存放在字符串常 量池中,而有的是运行时才被

创建.使用new关键字,存放在堆中。

0 0
原创粉丝点击