jsp/servlet中链接中出现中文乱码问题的解决办法及个人见解

来源：互联网发布：淘宝达人怎么注销编辑：程序博客网时间：2024/05/21 03:27

问题描述

其实这个问题一般会出现在带中文参数链接的GET请求，POST的一般不会，因为post请求对于服务器端的request.setCharacterEncoding("utf-8");是有效的，而get请求则无效。注意此处仅以tomcat服务器为例！

解决办法

方法一：前端手动编码2次，后端手动解码一次

前端代码

var url="${path}/search?searchWord="+encodeURI(encodeURI(content.value));xmlHttp.open("GET",url,true);xmlHttp.onreadystatechange=callback;xmlHttp.send(null);

后端代码

String searchWord=URLDecoder.decode(request.getParameter("searchWord"),"utf-8");

为什么前端手动编码2次，后端手动解码一次呢？

其实这个问题是错的，后端实际上也是解码2次。我们先从前端走起，中文字符被encodeURI一次，这里以”中国“为例子，一次编码后的结果为%E4%B8%AD，如果此时我们就编码一次然后跳转页面，后端接受到这个编码过的参数，服务器会首先自动把这个参数进行ISO-8859-1（tomcat容器默认的编码）解码，这里会将%解码为ISO-8859-1对应的字符，然后我们手动解码为utf-8时会因为%对应的编码变了，所以无法还原为“中国”。而我们在前端进行2次编码时，会将特殊字符%变成十六进制形式，%E4%B8%AD变成%E4%B8%AD%E5%9B%BD，这样服务器在对其进行ISO-8859-1解码时即可与utf-8的一致，然后我们再手动解码一次即可还原成中国。

方法二：前端手动编码一次，后端解码一次

前端代码

var url="${path}/search?searchWord="+encodeURI(content.value);xmlHttp.open("GET",url,true);xmlHttp.onreadystatechange=callback;xmlHttp.send(null);

后端代码

String searchWord=new String (request.getParameter("searchWord").getBytes("ISO-8859-1"),"UTF-8");

为什么这样呢？

因为前端把中文编码成utf-8，传到后端时由于tomcat默认编码为iso-8859-1，所以会把字符串解码为iso-8859-1格式，这时肯定乱码，因为编码与解码不一致，所以又将其编码成iso-8859-1格式，这时再将其按utf-8解码回去形成原始字符串的中文。

整个过程就是编码（utf-8）->解码(iso)->编码(iso)->解码(utf-8) 。

生动一点解释，比如有一个由无数碎块形成的狗，然后我打碎它，随身携带，等到了河边时，我把它组装成桥，等过了桥，我又打碎它，最后又拼成了狗，大概就是这个意思哦。

代码验证

import java.io.UnsupportedEncodingException;import java.net.URLDecoder;import java.net.URLEncoder;public class Test {public static void main(String[] args) throws UnsupportedEncodingException{String s1="中国";String s2=new String(URLDecoder.decode(URLEncoder.encode(s1, "utf-8"),"iso-8859-1").getBytes("iso-8859-1"),"utf-8");System.out.println(s2);}}

最后输出结果就是中国。

方法三：前端什么都不做，后端手动解码一次

前端代码

var url="${path}/search?searchWord="+content.value;xmlHttp.open("GET",url,true);xmlHttp.onreadystatechange=callback;xmlHttp.send(null);

后端代码

String searchWord=new String (request.getParameter("searchWord").getBytes("ISO-8859-1"),"UTF-8");

这是因为在传输之前，浏览器会根据页面的报头自动把中文编码。如果你已经编码过了，浏览器就不会再次编码。

以上是我个人的见解，未尽之处，请多多指教！

阅读全文

1 0

jsp/servlet中链接中出现中文乱码问题的解决办法及个人见解

问题描述

解决办法

方法一：前端手动编码2次，后端手动解码一次

为什么前端手动编码2次，后端手动解码一次呢？

方法二：前端手动编码一次，后端解码一次

为什么这样呢？

整个过程就是 编码（utf-8）->解码(iso)->编码(iso)->解码(utf-8) 。

生动一点解释，比如有一个由无数碎块形成的狗，然后我打碎它，随身携带，等到了河边时，我把它组装成桥，等过了桥，我又打碎它，最后又拼成了狗，大概就是这个意思哦。

代码验证

方法三：前端什么都不做，后端手动解码一次

整个过程就是编码（utf-8）->解码(iso)->编码(iso)->解码(utf-8) 。