java web项目各种乱码的解决方案

来源：互联网发布：lol扫号器数据编辑：程序博客网时间：2024/04/25 22:07

原创作品，允许转载，转载时请务必以超链接形式标明文章原始出处、作者信息和本人声明。否则将追究法律责任。
作者：永恒の_☆ 地址：http://blog.csdn.net/chenghui0317/article/details/10299103

一、前言

目前web项目中，很多乱码情况没有得到统一解决，或多或少影响开发效率和延长开发时间，所以总结一下关于java web项目各种乱码情况的解决方案。

二、准备条件

1、一个普通的web项目 webProject；

2、一个web服务器 Tomcat。

三、分析各种乱码的情况

1、项目的编码格式和页面文件的编码格式不一样是否有冲突？

答：webProject项目的编码格式是“GBK” ，项目下的页面中的编码格式是“UTF-8”，实践发现，项目的编码格式和页面的编码格式不一样不会有任何问题，显示的中文没有乱码。

查看项目的编码格式可以在 项目-->右键-->Properties--> Text file encoding 框内显示的具体值就是项目编码格式。

查看页面文件的编码格式可以在 页面-->右键-->Properties--> Text file encoding 框内显示的具体值就是页面文件的编码格式。

2、页面的文件编码格式和页面内容的编码格式不一样是否有冲突？

答：<1>将页面文件编码格式改为“UTF-8”，页面的内容的编码格式改为“GBK”，具体如下：

<%@ page language="java" contentType="text/html; charset=GBK" pageEncoding="GBK"%><!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"><html><head><meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"><title>Insert title here</title></head><body>测试中文是否乱码！@#！@#</body></html>

结果发现乱码了，具体效果如下：

所以页面的文件的编码格式必须和页面内容的编码格式一样，否则显示肯定乱码。

<2>另外，如果页面中格式在eclipse显示是好的，这个时候改变文件的编码格式也会乱码，如果非要改变文件编码的格式，可以这样：先将显示正确的内容复制一份然后修改文件的编码格式，这个时候文件内显示的是乱码，然后将复制的内容直接覆盖在这个页面中就好了。

<3>如果给将上面代码的pageEncoding改为"UTF-8"了发现显示正常了，所以可不可以这么说，页面显示是否乱码与charset指定的值无关？

<4>但是如果将上面代码的pageEncoding="UTF-8“这个属性直接去掉，然后显示效果，发现乱码了。如果把contentType属性的值改为 contentType="text/html; charset=UTF-8" 试试效果，具体如下：

所以可以这么理解：在没有指定pageEncoding属性的时候， charset 将会被忽略，如果没有指定pageEncoding属性，那么页面就会按照charset的编码值来显示具体效果。

<5>如果charset指定的值是GBK ，这个时候由于没有pageEncoding 所以页面内容按照GBk编码显示，但是与文件编码格式不符合，索引导致乱码。具体效果如下：

<6>现在又有另外一种情况，如果pageEncoding指定了UTF-8 ，但是charset指定的是 GBK ，GB2312 这个时候页面显示不会乱码。

<7>但是如果charset指定的是iso-8859-1，这个时候页面显示就是乱码了，具体效果如下：

<8>但是如果charset指定的是big5，这个是页面显示只是部分乱码，具体效果如下：

所以BIG5只会会繁体或者没有繁体格式的文字敏感。

<9>现在再实验一下，把contentType属相也去掉，指定meta标签中content属性中的charset=UTF-8 ，具体效果如下：

一种另外格式的乱码显示出来了。。。

综上所述：在jsp中如果要显示正确的内容，并且保证其显示不乱码，必须要指定contentType 或者 pageEncoding 的属性与文件编码格式一致。并且如果他们都存在，那么pageEncoding必须与文件编码格式一致，contentType必须是中文编码格式才行。

3、通过URL传递中文参数的时候接收的乱码怎么解决？

答：<1>新建一个servlet 名叫encodeServlet，在encode.jsp中添加超链接传递一个参数跳转到该serlvet。

超链接如下：

<a href="servlet/encodeServlet?param=中文">go to servlet</a>

servlet接收参数，具体get方法处理方式如下：

    /**     * @see HttpServlet#doGet(HttpServletRequest request, HttpServletResponse response)     */    protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {        String param = request.getParameter("param");                request.getRequestDispatcher("../encode.jsp?param="+param).forward(request, response);    }

调试之后发现，参数乱码了：

<2>这是因为参数通过url传递的时候是以http超文本协议传递的，它的格式是 iso-8859-1 ，所以可以设置tomcat服务器全局URL请求的格式，这样子所有的请求都会按照这个编码格式传递参数了。具体如下：

在tomcat安装目录的conf/server.xml中找到protocol="HTTP/1.1"的属性配置的连接器，在里面添加URIEncoding属性，具体如下：

URIEncoding ，顾名思义，它只针对 URL传递的请求，即get请求。。

<3>并且如果这么设置之后就不能再使用 param = new String(param.getBytes("iso-8859-1"),"UTF-8");转码了这样反而又变乱码了。

<4>另外还可以在接收到参数之后，重新指定编码也可以，具体如下：

String param = request.getParameter("param");param = new String(param.getBytes("iso-8859-1"),"UTF-8");

调试页面，发现并没有成功，具体效果如下：

没有效果，，，为什么，？因为页面的内容编码是UTF-8的，但是URL它传递的时候只能传递iso-8859-1 的编码，如果直接传递UTF-8编码的内容，那么无论后台怎么转换都没有效果。即使在servlet中重新指定charset 也无济于事。

<5>但是如果直接在地址栏输入： http://localhost:8080/webProject/servlet/encodeServlet?param=中文

并且修改一些代码，具体修改如下：

        response.setContentType("text/html;charset=UTF-8");        String param = request.getParameter("param");        param = new String(param.getBytes("iso-8859-1"),"UTF-8");

然后运行效果如下：

这样子是没问题的。。

<6>但是如果非要使用new String()重新编码来实现接收中文怎么办呢？，可以修改源码，具体如下：

request.setCharacterEncoding("UTF-8");String param = request.getParameter("param");param = new String(param.getBytes("iso-8859-1"),"UTF-8");

设置字符编码格式即可，具体效果如下：

实践证明，不管是超链接跳转到servlet 还是直接在url输入中文跳转到servlet 只使用request.setCharacterEncoding("UTF-8"); 统一编码格式都可以实现接收正确的参数。。

最开始一直以为request.setCharacterEncoding("UTF-8"); 只能处理post请求的参数，get请求的一样可以。

<7>既然这么有效果，那么为了避免重复的使用这行代码或者忘记使用而导致乱码，可以使用一个过滤器统一处理任何请求的编码格式。一劳永逸。

具体FIlter代码如下：

package com.struts2.util;import java.io.IOException;import javax.servlet.Filter;import javax.servlet.FilterChain;import javax.servlet.FilterConfig;import javax.servlet.ServletException;import javax.servlet.ServletRequest;import javax.servlet.ServletResponse;import org.apache.log4j.Logger;public class CharacterFilter implements Filter {private Logger logger = Logger.getLogger(this.getClass());String encoding = null;@Overridepublic void destroy() {logger.info("***************the CharacterFilter class' destroy() is invoking .***************");}@Overridepublic void doFilter(ServletRequest request, ServletResponse response,FilterChain filterChain) throws IOException, ServletException {request.setCharacterEncoding(encoding);response.setCharacterEncoding(encoding);filterChain.doFilter(request, response);}@Overridepublic void init(FilterConfig filterConfig) throws ServletException {logger.info("***************the CharacterFilter class' init() is invoking .***************");encoding = filterConfig.getInitParameter("encoding");}}

然后web.xml的配置如下：

  <filter>    <filter-name>characterFitler</filter-name>    <filter-class>com.struts2.util.CharacterFilter</filter-class>    <init-param>      <param-name>encoding</param-name>      <param-value>UTF-8</param-value>    </init-param>  </filter>  <filter-mapping>    <filter-name>characterFitler</filter-name>    <url-pattern>/*</url-pattern>  </filter-mapping>

<8>但是但是，实际开发中，上面的配置在处理get请求的时候有些时候可以指定编码成功，有的时候指定编码失败，成功率大概60-70%之间，至今不知道为何会这样。。。

解决方案：

使用js函数编码之后，然后后台解码即可，具体前台代码如下：

<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%><!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"><html><head><title>Insert title here</title></head><body>测试中文是否乱码！@#！@#<br/><a href="javascript:goTo()">go to servlet</a><script>function goTo(){    var param = encodeURI(encodeURI("中文"));  //这里编码必须调用两次，因为传递后台后java程序会解码一次，然后自己还要解码一次，    location.href="<%=request.getContextPath()%>/servlet/encodeServlet?param="+param;}</script></body></html>

后台解码代码如下：

//request.setCharacterEncoding("UTF-8");//response.setContentType("text/html;charset=UTF-8");String param = request.getParameter("param");//param = new String(param.getBytes("iso-8859-1"),"UTF-8");//这个用于直接处理转换get请求的编码//param = URLEncoder.encode(param);//这个是用于编码的方法param = URLDecoder.decode(param);//这个是用于解码的方法

ok ，这样子解决了js函数请求后台出现乱码的情况。

<9>另外在利用PrintWriter输出的时候出现乱码了，具体代码如下：

PrintWriter out = response.getWriter();out.print("接收的参数是："+param);out.close();

具体效果如下所示：

这里可以在servlet请求的顶部加上response.setContentType("text/html;charset=UTF-8"); 设置内容编码格式即可输出正确的效果，具体如下图：

综上所述：

（1）在参数的时候出现乱码，如果是get请求可以统一设置tomcat的uri编码处理格式，这样所有的url发送的请求都是以指定格式发送。

（2）request.setCharacterEncoding("UTF-8");主要用户 get/post请求中设置整个servlet的编码格式，好处是防止传递的中文参数乱码。

（3）response.setContentType("text/html;charset=UTF-8"); 主要用于指定当前请求中的内容格式，好处是防止输出内容的时候防止中文乱码。

（4）如果在处理中文乱码中以上方法都解决不了，那就要使用js前段编码两次，后台解码的方式处理。

4、是否有其他框架的配置直接解决中文乱码情况？

<1>如果项目中使用了struts2 ，可以在sturts.xml中配置一个常量，指定所有post请求的编码，具体如下：

<constant name="struts.i18n.encoding" value="UTF-8"></constant>

<2>如果在项目中使用了spring，可以在web.xml中配置一个过滤器也可以解决编码乱码的问题，具体如下：

  <filter>    <filter-name>encodingFilter</filter-name>    <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>    <init-param>      <param-name>encoding</param-name>      <param-value>UTF-8</param-value>    </init-param>    <init-param>      <param-name>forceEncoding</param-name>      <param-value>true</param-value>    </init-param>  </filter>  <filter-mapping>    <filter-name>encodingFilter</filter-name>    <url-pattern>/*</url-pattern>  </filter-mapping>