Java String类的秘密

来源：互联网发布：网络客服主管计划编辑：程序博客网时间：2024/05/16 12:38

String的本质

打开String的源码，类注释中有这么一段话“Strings are constant; their values cannot be changed after they are created. String buffers support mutable strings.Because String objects are immutable they can be shared.”。这句话总结归纳了String的一个最重要的特点：String是值不可变(immutable)的常量，是线程安全的(can be shared)。

图一 String类的定义和成员变量

第一，从图一可以看到，String类定义时使用了final修饰符，表明了String类的第二个特点：String类是不可继承的。

第二，下面是String类的成员变量定义，从类的实现上阐明了String值是不可变的(immutable)。
private final char value[];
private final int count;

图二 String类的concat()方法

我们看String类的concat方法。实现该方法第一步要做的肯定是扩大成员变量value的容量，扩容的方法重新定义一个大容量的字符数组buf。第二步就是把原来value中的字符copy到buf中来，再把需要concat的字符串值也copy到buf中来，这样子，buf中就包含了concat之后的字符串值。下面就是问题的关键了，如果value不是final的，直接让value指向buf，然后返回this，则大功告成，没有必要返回一个新的String对象。但是由于value是final型的，所以无法指向新定义的大容量数组buf，那怎么办呢？“return new String(0, count + otherLen, buf);”，这是String类concat实现方法的最后一条语句，重新new一个String对象返回。这下真相大白了吧！

从上面可以看出几点：

1）String类是final类，也即意味着String类不能被继承，并且它的成员方法都默认为final方法。在Java中，被final修饰的类是不允许被继承的，并且该类中的成员方法都默认为final方法。

2）上面列举出了String类中所有的成员属性，从上面可以看出String类其实是通过char数组来保存字符串的。

无论是sub操作、concat还是replace操作都不是在原有的字符串上进行的，而是重新生成了一个新的字符串对象。也就是说进行这些操作后，最原始的字符串并没有被改变。

　　在这里要永远记住一点：

　“对String对象的任何改变都不影响到原对象，相关的任何change操作都会生成新的对象”。

String的定义方法

在讨论String的定义方法之前，先了解一下常量池的概念。

常量池(constant pool)指的是在编译期被确定，并被保存在已编译的.class文件中的一些数据。它包括了关于类、方法、接口等中的常量，也包括字符串常量。常量池还具备动态性，运行期间可以将新的常量放入池中，String类的intern()方法是这一特性的典型应用。不懂吗？后面会介绍intern方法的。虚拟机为每个被装载的类型维护一个常量池，池中为该类型所用常量的一个有序集合，包括直接常量(string、integer和float常量)和对其他类型、字段和方法的符号引用.

String的定义方法归纳起来总共为三种方式：

使用关键字new，如：String s1 = new String("myString");

直接定义，如：String s1 = "myString";

串联生成，如：String s1 = "my" + "String";

第一种方式通过关键字new定义过程：在程序编译期，编译程序先去字符串常量池检查，是否存在“myString”,如果不存在，则在常量池中开辟一个内存空间存放“myString”；如果存在的话，则不用重新开辟空间，保证常量池中只有一个“myString”常量，节省内存空间。然后在内存堆中开辟一块空间存放new出来的String实例，在栈中开辟一块空间，命名为“s1”，存放的值为堆中String实例的内存地址，这个过程就是将引用s1指向new出来的String实例。

第二种方式直接定义过程：在程序编译期，编译程序先去字符串常量池检查，是否存在“myString”，如果不存在，则在常量池中开辟一个内存空间存放“myString”；如果存在的话，则不用重新开辟空间。然后在栈中开辟一块空间，命名为“s1”，存放的值为常量池中“myString”的内存地址。

String、StringBuffer以及StringBuilder

StringBuffer和StringBuilder都继承了抽象类AbstractStringBuilder，这个抽象类和String一样也定义了char[] value和int count，但是与String类不同的是，它们没有final修饰符。因此得出结论：String、StringBuffer和StringBuilder在本质上都是字符数组，不同的是，在进行连接操作时，String每次返回一个新的String实例，而StringBuffer和StringBuilder的append方法直接返回this，所以这就是为什么在进行大量字符串连接运算时，不推荐使用String，而推荐StringBuffer和StringBuilder。那么，哪种情况使用StringBuffe？哪种情况使用StringBuilder呢？

关于StringBuffer和StringBuilder的区别，翻开它们的源码，下面贴出append()方法的实现。

上面第一张图是StringBuffer中append()方法的实现，第二张图为StringBuilder对append()的实现。区别应该一目了然，StringBuffer在方法前加了一个synchronized修饰，起到同步的作用，可以在多线程环境使用。为此付出的代价就是降低了执行效率。因此，如果在多线程环境可以使用StringBuffer进行字符串连接操作，单线程环境使用StringBuilder，它的效率更高。

String、StringBuilder、StringBuffer三者的执行效率：

StringBuilder > StringBuffer > String

　　当然这个是相对的，不一定在所有情况下都是这样。

　　比如String str = "hello"+ "world"的效率就比StringBuilder st = new StringBuilder().append("hello").append("world")要高。

　　因此，这三个类是各有利弊，应当根据不同的情况来进行选择使用：

　　当字符串相加操作或者改动较少的情况下，建议使用 String str="hello"这种形式；

　　当字符串相加操作较多的情况下，建议使用StringBuilder，如果采用了多线程，则使用StringBuffer。

关于String的一些秘密

1、为什么在密码问题上char[]优先于String？

String在Java中是不可变对象，如果作为普通文本存储密码，那么它会一直存在内存中直至被垃圾收集器回收。这就意味着一旦创建了一个字符串，如果另一个进程把尝试内存的数据导出（dump），在GC进行垃圾回收之前该字符串会一直保留在内存中，那么该进程就可以轻易的读取到该字符串。

而对于数组，可以在使用该数组之后显示地擦掉数组中的内容，你可以使用其他不相关的内容把数组内容覆盖掉，例如，在使用完密码后，我们将char[]的值均赋为0，如果有人能以某种方式看到内存映像，他只能看到一串0；而如果我们使用的是字符串，他们便能以纯文本方式看到密码。因此，使用char[]是相对安全的。

推荐使用char[]，这是从安全角度来选择的。但是，我们应当注意到，即使是用char[]处理密码也只是降低被攻击的概率而已，还是会有其他方法攻破数组处理的密码。

另一方面，使用String的时候，你可能会不经意间将密码打印出来(如log文件)，此时，使用char[]就显得更加的安全了，如：

public static void main(String[] args) {

Object pw = "Password";

System.out.println("String: " + pw);

pw = "Password".toCharArray();

System.out.println("Array: " + pw);

}

此时的输出结果将会是

String: Password

Array: [C@5829428e

实际上，即使使用了char[]保存密码也仍然不够安全，内存中还是可能会有这串数据的零碎副本，因此，建议使用加密的密码来代替普通的文本字符串密码，并且在使用完后记得立即清除。

2、如何比较两个字符串？用“=”还是equals？

简单来说，“==”是用来检测俩引用是不是指向内存中的同一个对象，而equals()方法则检测的是两个对象的值是否相等。只要你想检测俩字符串是不是相等的，你就必须得用equals()方法。

如果你知道“字符串保留(string intern)”的概念那就更好了。如果不是用双引号声明的String对象，可以使用String提供的intern方法。intern 方法会从字符串常量池中查询当前字符串是否存在，若不存在就会将当前字符串放入常量池中。

3. 字符串对象能否用在switch表达式中？

从JDK7开始的话，我们就可以在switch条件表达式中使用字符串了，也就是说7之前的版本是不可以的。

1
2
3
4
5
6
7
8
9
// java 7 only!
switch(str.toLowerCase()) {
      case"a":
           value = 1;
           break;
      case"b":
           value = 2;
           break;
}

4、substring()方法具体是都干了些啥？

在JDK6中，这个方法只会在标识现有字符串的字符数组上给一个窗口来表示结果字符串，但是不会创建一个新的字符串对象。如果需要创建个新字符串对象，可以这样在结果后面+一个空的字符串：

str.substring(m, n) + ""

这么写的话就会创建一个新的字符数组来表示结果字符串。同时，这么写也有一定的几率让你的代码跑的更快，因为垃圾回收器会吧没有在使用的大字符串回收而留下子字符串。

0 0