java web项目各种乱码的解决方案

来源:互联网 发布:lol扫号器数据 编辑:程序博客网 时间:2024/04/25 22:07
原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本人声明。否则将追究法律责任。
作者:永恒の_☆ 地址:http://blog.csdn.net/chenghui0317/article/details/10299103

一、前言

    目前web项目中,很多乱码情况没有得到统一解决,或多或少影响开发效率和延长开发时间, 所以总结一下关于java web项目各种乱码情况的解决方案。


二、准备条件

     1、一个普通的web项目 webProject;

     2、一个web服务器 Tomcat。


三、分析各种乱码的情况

     1、项目的编码格式和页面文件的编码格式不一样是否有冲突?

      答:webProject项目的编码格式是“GBK” ,项目下的页面中的编码格式是“UTF-8”,实践发现,项目的编码格式和页面的编码格式不一样不会有任何问题,显示的中文没有乱码。    

     查看项目的编码格式可以在 项目-->右键-->Properties--> Text file encoding 框内显示的具体值就是项目编码格式。 

     查看页面文件的编码格式可以在 页面-->右键-->Properties--> Text file encoding 框内显示的具体值就是页面文件的编码格式。


     2、页面的文件编码格式和页面内容的编码格式不一样是否有冲突?

      答:<1>将页面文件编码格式改为“UTF-8”,页面的内容的编码格式改为“GBK”,具体如下:

<%@ page language="java" contentType="text/html; charset=GBK" pageEncoding="GBK"%><!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"><html><head><meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"><title>Insert title here</title></head><body>测试中文是否乱码!@#!@#</body></html>
结果发现 乱码了,具体效果如下:


所以页面的文件的编码格式必须和页面内容的编码格式一样,否则显示肯定乱码。

     <2>另外,如果页面中格式在eclipse显示 是好的,这个时候改变文件的编码格式也会乱码,如果非要改变文件编码的格式,可以这样: 先将显示正确的内容复制一份 然后修改文件的编码格式,这个时候文件内显示的是乱码,然后将复制的内容直接覆盖在这个页面中就好了。


     <3>如果给将上面代码的pageEncoding改为"UTF-8"了发现显示正常了,所以可不可以这么说,页面显示是否乱码与charset指定的值无关?


     <4>但是如果将上面代码的pageEncoding="UTF-8“这个属性直接去掉,然后显示效果,发现乱码了。 如果把contentType属性的值改为 contentType="text/html; charset=UTF-8" 试试效果,具体如下:


所以可以这么理解:在没有指定pageEncoding属性的时候, charset 将会被忽略,如果没有指定pageEncoding属性,那么页面就会按照charset的编码值来显示具体效果。


     <5>如果charset指定的值是GBK ,这个时候由于没有pageEncoding 所以页面内容按照GBk编码显示,但是与文件编码格式不符合 ,索引导致乱码。具体效果如下:

     <6>现在又有另外一种情况,如果pageEncoding指定了UTF-8 ,但是charset指定的是 GBK ,GB2312  这个时候页面显示不会乱码。


     <7>但是如果charset指定的是iso-8859-1,这个时候页面显示就是乱码了,具体效果如下:


     <8>但是如果charset指定的是big5,这个是页面显示只是部分乱码,具体效果如下:

所以BIG5只会会繁体或者没有繁体格式的文字敏感。


     <9>现在再实验一下,把contentType属相也去掉,指定meta标签中content属性中的charset=UTF-8 ,具体效果如下:

一种另外格式的乱码显示出来了。。。


综上所述:在jsp中如果要显示正确的内容,并且保证其显示不乱码,必须要指定contentType 或者 pageEncoding 的属性与文件编码格式一致。并且如果他们都存在,那么pageEncoding必须与文件编码格式一致,contentType必须是中文编码格式才行。


    3、通过URL传递中文参数的时候接收的乱码怎么解决?

     答:<1>新建一个servlet 名叫encodeServlet,在encode.jsp中添加超链接传递一个参数  跳转到该serlvet。

超链接如下:

<a href="servlet/encodeServlet?param=中文">go to servlet</a>

servlet接收参数,具体get方法处理方式如下:

    /**     * @see HttpServlet#doGet(HttpServletRequest request, HttpServletResponse response)     */    protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {        String param = request.getParameter("param");                request.getRequestDispatcher("../encode.jsp?param="+param).forward(request, response);    }
调试之后发现,参数乱码了:


     <2>这是因为参数通过url传递的时候是以http超文本协议传递的,它的格式是 iso-8859-1 ,所以可以设置tomcat服务器全局URL请求的格式,这样子所有的请求都会按照这个编码格式传递参数了。具体如下:

在tomcat安装目录的conf/server.xml中找到protocol="HTTP/1.1"的属性配置的连接器,在里面添加URIEncoding属性,具体如下:

<Connector URIEncoding="UTF-8" connectionTimeout="20000" port="8080" protocol="HTTP/1.1" redirectPort="8443"/>

URIEncoding ,顾名思义,它只针对 URL传递的请求,即get请求。。


     <3>并且如果这么设置之后就不能再使用 param = new String(param.getBytes("iso-8859-1"),"UTF-8");转码了  这样反而又变乱码了。


     <4>另外还可以在接收到参数之后,重新指定编码也可以,具体如下:

String param = request.getParameter("param");param = new String(param.getBytes("iso-8859-1"),"UTF-8");

调试页面,发现并没有成功,具体效果如下:

没有效果,,,为什么,?因为页面的内容编码是UTF-8的,但是URL它传递的时候只能传递iso-8859-1 的编码,如果直接传递UTF-8编码的内容,那么无论后台怎么转换都没有效果。 即使在servlet中重新指定charset 也无济于事。


     <5>但是如果直接在地址栏输入: http://localhost:8080/webProject/servlet/encodeServlet?param=中文

并且修改一些代码,具体修改如下:

        response.setContentType("text/html;charset=UTF-8");        String param = request.getParameter("param");        param = new String(param.getBytes("iso-8859-1"),"UTF-8");

然后运行效果如下:


这样子是没问题的。。


     <6>但是如果非要使用new String()重新编码来实现接收中文怎么办呢?,可以修改源码,具体如下:

request.setCharacterEncoding("UTF-8");String param = request.getParameter("param");param = new String(param.getBytes("iso-8859-1"),"UTF-8");
设置字符编码格式 即可,具体效果如下:



实践证明,不管是超链接 跳转到servlet 还是直接在url输入中文跳转到servlet 只使用request.setCharacterEncoding("UTF-8"); 统一编码格式 都可以实现接收正确的参数。。

最开始一直以为request.setCharacterEncoding("UTF-8"); 只能处理post请求的参数,get请求的一样可以。


     <7>既然这么有效果,那么为了避免重复的使用这行代码或者忘记使用而导致乱码,可以使用一个过滤器 统一处理任何请求的编码格式。一劳永逸。

具体FIlter代码如下:

package com.struts2.util;import java.io.IOException;import javax.servlet.Filter;import javax.servlet.FilterChain;import javax.servlet.FilterConfig;import javax.servlet.ServletException;import javax.servlet.ServletRequest;import javax.servlet.ServletResponse;import org.apache.log4j.Logger;public class CharacterFilter implements Filter {private Logger logger = Logger.getLogger(this.getClass());String encoding = null;@Overridepublic void destroy() {logger.info("***************the CharacterFilter class' destroy() is invoking .***************");}@Overridepublic void doFilter(ServletRequest request, ServletResponse response,FilterChain filterChain) throws IOException, ServletException {request.setCharacterEncoding(encoding);response.setCharacterEncoding(encoding);filterChain.doFilter(request, response);}@Overridepublic void init(FilterConfig filterConfig) throws ServletException {logger.info("***************the CharacterFilter class' init() is invoking .***************");encoding = filterConfig.getInitParameter("encoding");}}

然后web.xml的配置如下:

  <filter>    <filter-name>characterFitler</filter-name>    <filter-class>com.struts2.util.CharacterFilter</filter-class>    <init-param>      <param-name>encoding</param-name>      <param-value>UTF-8</param-value>    </init-param>  </filter>  <filter-mapping>    <filter-name>characterFitler</filter-name>    <url-pattern>/*</url-pattern>  </filter-mapping>

     <8>但是但是,实际开发中,上面的配置在处理get请求的时候 有些时候可以指定编码成功,有的时候指定编码失败, 成功率大概60-70%之间,至今不知道为何会这样。。。

解决方案:

使用js函数编码之后,然后后台解码即可,具体前台代码如下:

<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%><!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"><html><head><title>Insert title here</title></head><body>测试中文是否乱码!@#!@#<br/><a href="javascript:goTo()">go to servlet</a><script>function goTo(){    var param = encodeURI(encodeURI("中文"));  //这里编码必须调用两次,因为传递后台后java程序会解码一次,然后自己还要解码一次,    location.href="<%=request.getContextPath()%>/servlet/encodeServlet?param="+param;}</script></body></html>
后台解码代码如下:

//request.setCharacterEncoding("UTF-8");//response.setContentType("text/html;charset=UTF-8");String param = request.getParameter("param");//param = new String(param.getBytes("iso-8859-1"),"UTF-8");//这个用于直接处理转换get请求的编码//param = URLEncoder.encode(param);//这个是用于编码的方法param = URLDecoder.decode(param);//这个是用于解码的方法

ok ,这样子解决了js函数请求后台出现乱码的情况。


     <9>另外在利用PrintWriter输出的时候 出现乱码了,具体代码如下:

PrintWriter out = response.getWriter();out.print("接收的参数是:"+param);out.close();
具体效果如下所示:


这里可以在servlet请求的顶部加上response.setContentType("text/html;charset=UTF-8"); 设置内容编码格式 即可输出正确的效果,具体如下图:


综上所述:

(1)在参数的时候出现乱码,如果是get请求可以统一设置tomcat的uri编码处理格式,这样所有的url发送的请求都是以指定格式发送。

(2)request.setCharacterEncoding("UTF-8");主要用户 get/post请求中设置整个servlet的编码格式,好处是防止传递的中文参数乱码。

(3)response.setContentType("text/html;charset=UTF-8"); 主要用于指定当前请求中的内容格式,好处是防止输出内容的时候防止中文乱码。

(4)如果在处理中文乱码中以上方法都解决不了,那就要使用js前段编码两次,后台解码的方式处理。


    4、是否有其他框架的配置直接解决中文乱码情况?

     <1>如果项目中使用了struts2 ,可以在sturts.xml中配置一个常量,指定所有post请求的编码,具体如下:

<constant name="struts.i18n.encoding" value="UTF-8"></constant>


     <2>如果在项目中使用了spring,可以在web.xml中配置一个过滤器也可以解决编码乱码的问题,具体如下:

  <filter>    <filter-name>encodingFilter</filter-name>    <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>    <init-param>      <param-name>encoding</param-name>      <param-value>UTF-8</param-value>    </init-param>    <init-param>      <param-name>forceEncoding</param-name>      <param-value>true</param-value>    </init-param>  </filter>  <filter-mapping>    <filter-name>encodingFilter</filter-name>    <url-pattern>/*</url-pattern>  </filter-mapping>