乱码问题

来源:互联网 发布:c语言按位取反程序 编辑:程序博客网 时间:2024/04/29 08:12

编码:字符串变为字节数组
   数据存储到硬盘上-----编码
   用记事本打开--------解码

解码:字节数组变为字符串

如果中文字符使用ISO8859-1编码,那么解码也不可能解对,因为ISO8859-1中不存在中文,没有
码表对应
String---->byte[];str.getBytes();


byte[]---->String;new String(byte[]);

GBK:两个字节代表一个字符
UTF-8:根据需要用一定数量的字节进行编码:ASCII码用一个字节,那如何确定是读一个字节还是两个字节呢?
中文用三个字节,字节前面加了一个标识头信息,用于确定读取时是读取一个还是两个,三个字节

浏览器提交是根据浏览器的默认的编码,如果浏览器的编码改变了就会根据改变后的编码
中国————GBK编码——————ISO8859——1解码——————ISO8859——1编码-------GBK解码:
可以解决中间的乱码问题因为ISO8859——1不存在中文,不会改变编码后的码表

中国————GBK编码——————utf-8解码——————utf-8编码-------GBK解码:最终会是乱码,
应为两者均可识别中文,而GBK编码是两个字节,utf-8,解码是根据三个字节,所以再次编码解码将会乱码

request.setCharacterEncoding("tuf-8");//只对post有效
get方法乱码问题只能手工解决:
String username=request.getParameter("username");
username=new String(username.getBytes("ISO8859-1"),"utf-8");
对数据进行编码后再解码,来解决乱码,即上述的中国————GBK编码——————ISO8859——1解码——————ISO8859——1编码-------GBK解码:问题

 

其他的一些问题,参考了文章,地址如下

 

http://www.cnblogs.com/footman265/archive/2010/11/22/1884708.html
原创粉丝点击