字符集系列三之ISO8859_1、GBK、gb2312

来源:互联网 发布:php伪造referer跳转 编辑:程序博客网 时间:2024/05/18 03:17

这里有一段程序:

String a = new String("");

String b = new String(a.getByte(),"ISO8859_1");

String c = new String(a.getByte(),"gb2312");

System.out.println("b="+b+" c="+c);

String b = new String(b.getByte("ISO8859_1"),"GBK");

String c = new String(a.getByte("gb2312"),"GBK");

System.out.println("b="+b+" c="+c);

 

虚拟机的内码是GBK:

输出结果是:

b=?? c=??

b=碁 c=??

这就是奇妙之处了。

当a被转化为gb2312时由于在编码表里找不到对应的编码,故而被替代为?的编码,再转回来就是?了

而被转化为ISO8859_1时,之间将编码平移过去虽然不能正常显示,但是保证了正常转化回来。

ISO8859_1是个比较特殊的字符集,它是一个8位的编码,这就让他成为一个非常好的中介机构,会忠实的将每个字节的数据记录下来而不改变,估计这是web传输和jdbc传输使用它为字符集的原因吧。

原创粉丝点击