字符集个人理解

来源:互联网 发布:java线程安全的例子 编辑:程序博客网 时间:2024/06/18 15:04

编码其实,就是二进制数,与字符的映射关系。

那么,它只和二进制数和字符有关。
Java内存中的字符(字符串),都是Unicode编码的。
所以,当二进制数是GBK编码的时候,首先要用解码器将GBK转换成Unicode编码,然后再保持到字符当中。
也就是说,应该先得到二进制数据:byte [] data = ...;
然后,生成字符串:String str = new String(data,"GBK");
这样,这个字符串就可以正常显示了。
如果,输出的数据,要UTF-8编码的,那么,应该是这样:byte [] outData = str.getBytes("UTF-*");
然后,out.write(outData);将数据写入的IO当中。

不应该这种写法:new String(str.getBytes("gbk"), "utf-8");
这种写法,一般都是对字符数据编码理解得不透彻,才这么写的。

编码编的是二进制数据,编码后,二进制数据(字节流或字节数组)会转换成Java语言的字符(串)型的数据,供编程人员使用。

拿ajax来说,默认编码是utf-8,我们不用管后端的项目编码是什么,只需要按照utf-8的格式来编码即可:new String(str.getBytes(), "utf-8");

之前一直搞不清spring的字符集过滤器到底有什么作用,现在明白了。

0 0
原创粉丝点击