乱码问题

来源：互联网发布：c语言按位取反程序编辑：程序博客网时间：2024/04/29 08:12

编码：字符串变为字节数组
数据存储到硬盘上-----编码
用记事本打开--------解码

解码：字节数组变为字符串

如果中文字符使用ISO8859-1编码，那么解码也不可能解对，因为ISO8859-1中不存在中文，没有
码表对应
String---->byte[];str.getBytes();

byte[]---->String;new String(byte[]);

GBK：两个字节代表一个字符
UTF-8：根据需要用一定数量的字节进行编码：ASCII码用一个字节，那如何确定是读一个字节还是两个字节呢？
中文用三个字节，字节前面加了一个标识头信息，用于确定读取时是读取一个还是两个，三个字节

浏览器提交是根据浏览器的默认的编码，如果浏览器的编码改变了就会根据改变后的编码
中国————GBK编码——————ISO8859——1解码——————ISO8859——1编码-------GBK解码：
可以解决中间的乱码问题因为ISO8859——1不存在中文，不会改变编码后的码表

中国————GBK编码——————utf-8解码——————utf-8编码-------GBK解码：最终会是乱码，
应为两者均可识别中文，而GBK编码是两个字节，utf-8，解码是根据三个字节，所以再次编码解码将会乱码

request.setCharacterEncoding("tuf-8");//只对post有效
get方法乱码问题只能手工解决：
String username=request.getParameter("username");
username=new String(username.getBytes("ISO8859-1"),"utf-8");
对数据进行编码后再解码，来解决乱码，即上述的中国————GBK编码——————ISO8859——1解码——————ISO8859——1编码-------GBK解码：问题

其他的一些问题，参考了文章，地址如下

http://www.cnblogs.com/footman265/archive/2010/11/22/1884708.html