结合tomcat源码谈谈http get请求的乱码问题

来源:互联网 发布:张学良不抵抗 知乎 编辑:程序博客网 时间:2024/06/09 22:00

今天在公司做项目过程中,在一个get请求的时候遇到了中文乱码问题,由于之前对乱码问题没怎么深入研究过,于是囫囵吞枣般的弄了一翻,最后发现还是乱码。于是决定深入研究一下这坑爹的中文乱码问题。因为导致乱码的原因有多种,这里我只深入谈谈get请求这种情况。(其余可参考JSP中文乱码问题终极解决方案)

get请求

get方法的参数是附加在url后面进行传递的,举个栗子, ,如图分别输入中文和英文后,向服务端以get方式发出http请求,然后就会以这样的方式传递到服务端
,然后用chrome查看http的请求报投头,发现这两个参数是以Query String包装起来的,
注意,起码到这个时候,一切看起来还是正常的,然后进入服务端看看,发现问题来了,控制台输出中文变乱码了。浏览器端正常,服务端输出乱码,说明请求在服务端也就是tomcat处理的时候出问题了,于是设置断点debug了一下,发现在org.apache.tomcat.util.http.Parameters类的getCharset实例方法中,首先要判断encoding是否有设置,没有的话就返回默认的DEFAULT_CHARSET静态变量,tomcat中这个变量设置为ISO-8859-1,即如果我们不预先设定好字符编码方式,tomcat就会用默认的ISO-8859-1方式去编码,而这种编码方式是不适合中文的,因为ISO-8859-1编码是将1个字节当成1个字符,但是中文2个字节组成1个字符,因此在对中文编码的时候,原本2个中文应该有2个字符,但是按照默认的编码方式,就会解析出4个字符,因此出现乱码,所以需要修改Tomcat服务器的配置文件才能解决问题。在这里修改Tomcatconf目录下的server.xml配置文件,手动加上编码的方式,之后显示就正常了

资料参考:Tomcat处理HTTP请求源码分析(上)
Tomcat处理HTTP请求源码分析(下)   

原创粉丝点击