servlet编码

来源:互联网 发布:类似maka软件 编辑:程序博客网 时间:2024/05/19 06:35
Servlet的中文输出问题
原理:
1、  浏览器接收到的中文字符并不是中文符号本身,而是它的某种字符集编码的数据。(字符格式)
2、  浏览器必须使用正确的字符集编码进行查看,才能将它所接收到的数据显示为正确的中文字符。(用正确的字符集格式转换成汉字)
3、  当Servlet程序仅仅需要输出纯文本格式的响应正文时,通常应调用ServletResponse对象的getWriter方法返回一个PrintWriter对象,然后使用这个PrintWriter对象将文本内容写入到客户端。
4、  Java程序中的字符文本在内存中是以unicode编码的形式存在的,PrintWriter对象在输出字符文本时,需要先将它们转换成其他某种字符集编码的字节数组后输出。
5、  ServletResponse对象的getWriter方法返回的PrintWriter对象默认使用ISO8859-1字符集编码进行Unicode字符串到字节数组的转换,由于ISO8859-1字符集中根本就没有中文字符,Unicode编码的中文字符将被转换成无效的字符编码后输出给客户端。
解决办法:
1、  ServletResponse接口中定义了setCharacterEncoding、setContentType和setLocale等方法来指定ServletResponse.getWriter方法返回的PrintWriter对象所使用的字符集编码。
2、  调用ServletResponse接口中定义的setContentType方法,在HTTP响应消息的Content-Type头字段中指定响应正文的字符集编码。  
response.setContentType("text/html;charset=utf-8");(指定用utf-8编码)
Html文档
浏览器对请求参数中的字符(中国)的某种字符集编码(utf-8)进行了url编码
中  utf-8的编码是E4B8AD  ——>url编码
请求消息发送到web服务器
Web服务器从请求消息把每一个参数名和参数值分离出来
对每一个参数名和参数值针对某种字符集编码()进行url解码(解码后是字节数组E4 B8 AD)——按照某种字符集编码(utf-8)(中)
0 0
原创粉丝点击