jsp/servlet中链接中出现中文乱码问题的解决办法及个人见解

来源:互联网 发布:淘宝达人怎么注销 编辑:程序博客网 时间:2024/05/21 03:27

问题描述

其实这个问题一般会出现在带中文参数链接的GET请求,POST的一般不会,因为post请求对于服务器端的request.setCharacterEncoding("utf-8");是有效的,而get请求则无效。注意此处仅以tomcat服务器为例!

解决办法

方法一:前端手动编码2次,后端手动解码一次

前端代码
var url="${path}/search?searchWord="+encodeURI(encodeURI(content.value));xmlHttp.open("GET",url,true);xmlHttp.onreadystatechange=callback;xmlHttp.send(null);
后端代码
String searchWord=URLDecoder.decode(request.getParameter("searchWord"),"utf-8");


为什么前端手动编码2次,后端手动解码一次呢?

其实这个问题是错的,后端实际上也是解码2次。我们先从前端走起,中文字符被encodeURI一次,这里以”中国“为例子,一次编码后的结果为%E4%B8%AD,如果此时我们就编码一次然后跳转页面,后端接受到这个编码过的参数,服务器会首先自动把这个参数进行ISO-8859-1(tomcat容器默认的编码)解码,这里会将%解码为ISO-8859-1对应的字符,然后我们手动解码为utf-8时会因为%对应的编码变了,所以无法还原为“中国”。而我们在前端进行2次编码时,会将特殊字符%变成十六进制形式,%E4%B8%AD变成%E4%B8%AD%E5%9B%BD,这样服务器在对其进行ISO-8859-1解码时即可与utf-8的一致,然后我们再手动解码一次即可还原成中国。

方法二:前端手动编码一次,后端解码一次

前端代码
var url="${path}/search?searchWord="+encodeURI(content.value);xmlHttp.open("GET",url,true);xmlHttp.onreadystatechange=callback;xmlHttp.send(null);
后端代码
String searchWord=new String (request.getParameter("searchWord").getBytes("ISO-8859-1"),"UTF-8");

为什么这样呢?

因为前端把中文编码成utf-8,传到后端时由于tomcat默认编码为iso-8859-1,所以会把字符串解码为iso-8859-1格式,这时肯定乱码,因为编码与解码不一致,所以又将其编码成iso-8859-1格式,这时再将其按utf-8解码回去形成原始字符串的中文。

整个过程就是 编码(utf-8)->解码(iso)->编码(iso)->解码(utf-8) 。

生动一点解释,比如有一个由无数碎块形成的狗,然后我打碎它,随身携带,等到了河边时,我把它组装成桥,等过了桥,我又打碎它,最后又拼成了狗,大概就是这个意思哦。

代码验证

import java.io.UnsupportedEncodingException;import java.net.URLDecoder;import java.net.URLEncoder;public class Test {public static void main(String[] args) throws UnsupportedEncodingException{String s1="中国";String s2=new String(URLDecoder.decode(URLEncoder.encode(s1, "utf-8"),"iso-8859-1").getBytes("iso-8859-1"),"utf-8");System.out.println(s2);}}

最后输出结果就是中国。

方法三:前端什么都不做,后端手动解码一次

前端代码
var url="${path}/search?searchWord="+content.value;xmlHttp.open("GET",url,true);xmlHttp.onreadystatechange=callback;xmlHttp.send(null);
后端代码
String searchWord=new String (request.getParameter("searchWord").getBytes("ISO-8859-1"),"UTF-8");
这是因为在传输之前,浏览器会根据页面的报头自动把中文编码。如果你已经编码过了,浏览器就不会再次编码。


以上是我个人的见解,未尽之处,请多多指教!

阅读全文
1 0
原创粉丝点击