字符集系列三之ISO8859_1、GBK、gb2312

来源:互联网 发布:yum y install wget 编辑:程序博客网 时间:2024/05/16 17:19

String a = new String("碁");String b = new String(a.getBytes(),"ISO8859_1");String c = new String(a.getBytes(),"gb2312");System.out.println("b="+b+" c="+c);String b = new String(b.getBytes("ISO8859_1"),"GBK");String c = new String(a.getBytes("gb2312"),"GBK");System.out.println("b="+b+" c="+c);

虚拟机的内码是GBK:

输出结果是:

b=?? c=??

b=碁 c=??

这就是奇妙之处了。

当a被转化为gb2312时由于在编码表里找不到对应的编码,故而被替代为?的编码,再转回来就是?了

而被转化为ISO8859_1时,之间将编码平移过去虽然不能正常显示,但是保证了正常转化回来。

ISO8859_1是个比较特殊的字符集,它是一个8位的编码,这就让他成为一个非常好的中介机构,会忠实的将每个字节的数据记录下来而不改变,估计这是web传输和jdbc传输使用它为字符集的原因吧。

getBytes() 

           使用平台默认的字符集将此 String 解码为字节序列,并将结果存储到一个新的字节数组中。


getBytes(String charsetName) 

           使用指定的字符集将此 String 解码为字节序列,并将结果存储到一个新的字节数组中。


String(byte[] bytes, String charsetName) 
           构造一个新的 String,方法是使用指定的字符集解码指定的字节数组。


String(byte[] bytes) 
           构造一个新的 String,方法是使用平台的默认字符集解码字节的指定数组。

原创粉丝点击