服务器后端servlet中文信息返回，使用response乱码的问题及setCharacterEncoding()与setContentType()区别

来源：互联网发布：安川伺服软件下载编辑：程序博客网时间：2024/05/17 13:40

遇见了使用servlet时候输出页面“中文”信息的时候，显示总是？？？？？？，或者是中文乱码。我感到难过。查询到解决方案贴下。

首先不论是使用reponse.setCharacterEncoding("UTF-8")还是使用response.setHeader("content-type", "text/html;charset=UTF-8");都要注意一点。就是要放在doGet或者是doPost的最上面，然后再去使用PrintWriter out = response.getWriter();或者是OutputStream outputStream = response.getOutputStream(); 不然没用。

第二个问题就是:服务器后端servlet中文信息返回，使用response乱码的问题中，setCharacterEncoding()与setContentType()区别是什么。就是上面红字了里面的两种方法有时候会一个用utf-8还是会乱码，这是为什么。其实这两个函数的作用是有一点不一样的。所以用response.setHeader("content-type", "text/html;charset=UTF-8");更方便啦~~一本万利.

原因看下面的转载内容吧~

转载自博客：http://blog.csdn.net/mingliangniwo/article/details/44178491

他的博客也是转的，转自这个博客：http://blog.csdn.net/jiangwei0910410003/article/details/22886847

这里我们输出的是"Hello World"英文，使用浏览器去访问的时候是没有乱码问题，下面我们在将代码改写一下，

[java] view plaincopy
response.getOutputStream.write("中国".getBytes("utf-8"));  

这时候我们使用浏览器去访问数据的时候，当然我们可能会看到"中国"，也有可能看到的是乱码，原因很简单，如果浏览器使用的是gb2312码表打开的话，就是乱码，如果是使用utf-8码表打开的话，就是正常的数据。当然我们可以手动的去设置浏览器的打开码表，默认的是gb2312(系统默认码表)，那么如果我们使用utf-8将数据写入到Response中，然后浏览器使用的是默认的码表去拿取数据进行显示，那肯定是乱码了，那么我们该怎么办呢？，让用户手动的去修改浏览器的打开码表，那貌似太恶心了，所以这里我们就要介绍一个响应头字段的作用了，Content-type:这个头就是告诉浏览器以什么方式打开数据，并且指定相应的码表，具体代码如下：

[java] view plaincopy
response.setHeader("Content-type", "text/html;charset=utf-8");  

这样,我们就可以告诉浏览器以utf-8码表去显示数据，这样也就不会再有乱码的问题了。

这里我们在扩展一下就是还有一种方式控制浏览器的打开码表，那就是使用<meta>标签来实现：

[java] view plaincopy
response.getOutputStream().write("<meta http-equiv='content-type' content='text/html;charset=utf-8'>".getBytes());  

这里我们组建了一个<meta>标签，并将这个标签写入到Response容器中，当客户机使用去拿取这段数据的时候，发现有html中的标签<meta>所以会通过一些处理会把上面的字符串当做是是html代码来显示。这里使用了<meat>标签来解决乱码问题的。

上面使用的是字节流的方式来给客户机发送数据的，有时候我们可能会使用字符流来显示数据，因为字符流在特定场合下回比字节流更方便的输出，其实这里使用response.getWriter()来获取一个PrintWriter字符流对象，然后我们可以使用PrintWriter对象的write方法直接写字符串数据，但是这里也是需要来解决乱码的问题，而且这里的需要解决的问题比上面的字节流更麻烦。下面来看一下吧：

[java] view plaincopy
response.getWriter.write("中国");  

通过上面的方法进行输出，显示的是乱码，首先servlet将"中国"字符串写入到Response容器中，但是这里需要注意的一个问题就是，将"中国"写入到Response中，那么Response容器中是怎么存储"中国"字符串的，因为Response这些技术都是老外发明的，所以他们肯定是使用iso8859-1编码来进行存储字节数据的，所以这里就会有一个大问题，因为我们知道iso8859-1使用的是单个字节表示一个字符的，而gb2312使用的是两个字节，utf-8使用的是三个字节，所以Response将使用iso8859-1码表进行编码，那么存储的是两个乱码字节，所以，当客户机从Response容器中去拿取数据的时候显示的肯定是乱码，那么当我们使用

[java] view plaincopy
response.setHeader("Content-type","text/html;charset=utf-8")  

来设置浏览器的打开数据的码表，但是我们会发现还是显示两个？？,这个也是很简单的，因为我们在编写JavaSE中，也会知道这个问题就是将utf-8这种多字节的码表转到低字节码表iso8859-1，当我这时候在将结果转成utf-8的数据，这时候是不可能在转回原始数据的。所以说我们应该去修改Response容器的码表，将其码表改成utf-8，这时候就可以"中国"写入到Response容器中，而且会以utf-8的码表进行存储的，当客户机在用utf-8码表打开的时候就不会有问题了，

上面我们使用字节流来进行书写数据的时候，是没有问题的，因为是将"中国"的字节数据直接写到Response容器中的，所以不会涉及到Response容器编码的问题。

所以说当我们在使用字符流写入数据的时候，我们一定要记得修改Response容器的编码，不然会出现乱码的

[java] view plaincopy
response.setCharacterEncoding("utf-8");  
response.setHeader("content-type", "text/html;charset=utf-8");  

所以要用这两行代码的，同时response对象中还有一个方法:setContentType,这个方法可以直接设置Content-type字段的值

[java] view plaincopy
response.setContentType("text/html;charset=utf-8");  

其实这一行代码就相当于上面的两行代码的效果，因为在setContentType方法中已经调用了setCharacterEncoding方法设置了Response容器的编码了。

阅读全文

0 0