服务器后端servlet中文信息返回,使用response乱码的问题及setCharacterEncoding()与setContentType()区别

来源:互联网 发布:安川伺服软件下载 编辑:程序博客网 时间:2024/05/17 13:40

遇见了使用servlet时候输出页面“中文”信息的时候,显示总是??????,或者是中文乱码。我感到难过。查询到解决方案贴下。


首先不论是使用reponse.setCharacterEncoding("UTF-8")还是使用response.setHeader("content-type", "text/html;charset=UTF-8");都要注意一点。就是要放在doGet或者是doPost的最上面,然后再去使用PrintWriter out = response.getWriter();或者是OutputStream outputStream = response.getOutputStream(); 不然没用。

第二个问题就是:服务器后端servlet中文信息返回,使用response乱码的问题中,setCharacterEncoding()与setContentType()区别是什么。就是上面红字了里面的两种方法有时候会一个用utf-8还是会乱码,这是为什么。其实这两个函数的作用是有一点不一样的。所以用response.setHeader("content-type", "text/html;charset=UTF-8");更方便啦~~一本万利.

原因看下面的转载内容吧~


转载自博客:http://blog.csdn.net/mingliangniwo/article/details/44178491

他的博客也是转的,转自这个博客:http://blog.csdn.net/jiangwei0910410003/article/details/22886847


这里我们输出的是"Hello World"英文,使用浏览器去访问的时候是没有乱码问题,下面我们在将代码改写一下,

[java] view plaincopy在CODE上查看代码片派生到我的代码片
  1. response.getOutputStream.write("中国".getBytes("utf-8"));  
这时候我们使用浏览器去访问数据的时候,当然我们可能会看到"中国",也有可能看到的是乱码,原因很简单,如果浏览器使用的是gb2312码表打开的话,就是乱码,如果是使用utf-8码表打开的话,就是正常的数据。当然我们可以手动的去设置浏览器的打开码表,默认的是gb2312(系统默认码表),那么如果我们使用utf-8将数据写入到Response中,然后浏览器使用的是默认的码表去拿取数据进行显示,那肯定是乱码了,那么我们该怎么办呢?,让用户手动的去修改浏览器的打开码表,那貌似太恶心了,所以这里我们就要介绍一个响应头字段的作用了,Content-type:这个头就是告诉浏览器以什么方式打开数据,并且指定相应的码表,具体代码如下:

[java] view plaincopy在CODE上查看代码片派生到我的代码片
  1. response.setHeader("Content-type""text/html;charset=utf-8");  
这样,我们就可以告诉浏览器以utf-8码表去显示数据,这样也就不会再有乱码的问题了。

这里我们在扩展一下就是还有一种方式控制浏览器的打开码表,那就是使用<meta>标签来实现:

[java] view plaincopy在CODE上查看代码片派生到我的代码片
  1. response.getOutputStream().write("<meta http-equiv='content-type' content='text/html;charset=utf-8'>".getBytes());  
这里我们组建了一个<meta>标签,并将这个标签写入到Response容器中,当客户机使用去拿取这段数据的时候,发现有html中的标签<meta>所以会通过一些处理会把上面的字符串当做是是html代码来显示。这里使用了<meat>标签来解决乱码问题的。


上面使用的是字节流的方式来给客户机发送数据的,有时候我们可能会使用字符流来显示数据,因为字符流在特定场合下回比字节流更方便的输出,其实这里使用response.getWriter()来获取一个PrintWriter字符流对象,然后我们可以使用PrintWriter对象的write方法直接写字符串数据,但是这里也是需要来解决乱码的问题,而且这里的需要解决的问题比上面的字节流更麻烦。下面来看一下吧:

[java] view plaincopy在CODE上查看代码片派生到我的代码片
  1. response.getWriter.write("中国");  
通过上面的方法进行输出,显示的是乱码,首先servlet将"中国"字符串写入到Response容器中,但是这里需要注意的一个问题就是,将"中国"写入到Response中,那么Response容器中是怎么存储"中国"字符串的,因为Response这些技术都是老外发明的,所以他们肯定是使用iso8859-1编码来进行存储字节数据的,所以这里就会有一个大问题,因为我们知道iso8859-1使用的是单个字节表示一个字符的,而gb2312使用的是两个字节,utf-8使用的是三个字节,所以Response将使用iso8859-1码表进行编码,那么存储的是两个乱码字节,所以,当客户机从Response容器中去拿取数据的时候显示的肯定是乱码,那么当我们使用

[java] view plaincopy在CODE上查看代码片派生到我的代码片
  1. response.setHeader("Content-type","text/html;charset=utf-8")  
来设置浏览器的打开数据的码表,但是我们会发现还是显示两个??,这个也是很简单的,因为我们在编写JavaSE中,也会知道这个问题就是将utf-8这种多字节的码表转到低字节码表iso8859-1,当我这时候在将结果转成utf-8的数据,这时候是不可能在转回原始数据的。所以说我们应该去修改Response容器的码表,将其码表改成utf-8,这时候就可以"中国"写入到Response容器中,而且会以utf-8的码表进行存储的,当客户机在用utf-8码表打开的时候就不会有问题了,

上面我们使用字节流来进行书写数据的时候,是没有问题的,因为是将"中国"的字节数据直接写到Response容器中的,所以不会涉及到Response容器编码的问题。


所以说当我们在使用字符流写入数据的时候,我们一定要记得修改Response容器的编码,不然会出现乱码的

[java] view plaincopy在CODE上查看代码片派生到我的代码片
  1. response.setCharacterEncoding("utf-8");  
  2. response.setHeader("content-type""text/html;charset=utf-8");  
所以要用这两行代码的,同时response对象中还有一个方法:setContentType,这个方法可以直接设置Content-type字段的值

[java] view plaincopy在CODE上查看代码片派生到我的代码片
  1. response.setContentType("text/html;charset=utf-8");  

其实这一行代码就相当于上面的两行代码的效果,因为在setContentType方法中已经调用了setCharacterEncoding方法设置了Response容器的编码了。


阅读全文
0 0