java web,charset编码设置正确情况下出现部分中文正常,部分中文乱码的问题

来源:互联网 发布:淘宝助理外链图片 编辑:程序博客网 时间:2024/06/05 04:26

今天写java web遇到大部分中文正常,小部分中文乱码问题。

最初不理解,为什么只有一小部分中文出乱码。

以前一直错误地认为乱码问题现象只有两种:jsp编码设置正确,中文都能显示正常;jsp页面编码设置不正确,中文都显示为乱码。不会出现大部分中文正常,小部分中文乱码的情况。

<%@ page contentType="text/html;charset=utf-8" %>配置是正确的。

在网上仔细看了《中文国际化问题权威解析之三:java中文问题分析》(http://www.360doc.com/content/09/0319/22/111235_2858924.shtml),终于知道小部分中文乱码问题是由web容器(tomcat)内部编码与页面编码不一致引起的。

tomcat内部时默认使用ISO-8859-1编码。jsp页面编码为utf-8。

由此断定,jsp页面的中文字符必定经过utf-8 ->ISO-8859-1和 ISO-8859-1->utf-8两次编码转换环节。

大部分中文经过如上两个环节仍可正常显,如“登录”“注册”。有些中文经过utf-8 ->ISO-8859-1转码后,再由ISO-8859-1->utf-8的转码不能还原到原样,例如“退出”(具体原因参见《中文国际化问题权威解析之三:java中文问题分析》

因此java web在jsp页面编码设置正确的情况下,竟会出现小部分中文乱码。


那么解决此问题的方法呢?网上一般给出的解决方案是直接配置tomcat内部编码与jsp页面编码一致。

但是,这样解决方法存在一些问题:1、当该web应用打包为war部署到其它tomcat服务器时,又必须修改tomcat配置,重复操作。2、修改tomcat配置,必然影响该tomcat的其它使用不同编码的web应用。

采用java国际化(或利用struts框架国际化)解决方案,可以避免上述问题。

0 0