中文乱码

来源:互联网 发布:淘宝网上买的铁观音9.9 编辑:程序博客网 时间:2024/04/24 08:47

2.让jsp说hello

注意

为了保证循序渐进的学习状态,我们这里无可奈何的使用了一些在正式工作时明令禁止的代码,请大家在阅读此章务求领会精神,千万不要死记硬背,以防遗憾终身。

如果你不满足以下任一条件,请继续阅读,否则请跳过此后的部分,进入下一章:第 3 章 请求的跳转与转发

  1. 了解从request中获得参数的方法。

  2. 了解一些jsp指令(directive)。

  3. 了解中文乱码问题。

2.1. 另一个简单jsp

上一篇举的例子很单纯,无论谁向服务器发送请求,服务器都只计算当前系统时间,然后把这个时间制作成http响应发还给浏览器。

可惜这种单向的响应没办法实现复杂的业务,比如像这样:

客户在这个页面输入自己的名字,然后提交:

服务器会对你说:“你好啊,XXX。”

返回刚才的页面,再输入另外一个名字:

提交以后就变成这样:

呵呵,神奇吧,服务器知道你叫什么名字,而且还会向你问好。

虽然咱们都知道这只是从请求中获得了用户名,加上欢迎信息再发送回浏览器,但最终用户会感到更亲切。下面就让我们来看一下如何从请求获得参数吧。

首先用户输入页面会是这样的:

<form action="test.jsp">    username : <input type="text" name="username" />    <br />    <input type="submit"></form>        

这里是一个简单的form,里面只有一个名叫username的文本框,点击提交之后它的值就会提交到后台服务器上的test.jsp。那么在jsp里,咱们如何得到用户输入的username呢?

Hello <%=request.getParameter("username")%>        

呼呼,原来就这么简单,前面的Hello 是一成不变的,后面紧接<%%>包含的java代码。

只要是<%%>中间的部分就会被当成java代码执行,咱们就来看看jsp里是通过什么途径获得请求中的参数吧。

首先是request,翻译过来就是请求,它被称作jsp九大默认对象之一,与http请求相关的操作都是通过request实现的,你完全可以把它看作是浏览器发送过来的http请求。

请求里就包含了我们需要获得的参数,你想要知道username的值吗?好的,只要调用getParameter("username")就可以获得了,你交给request一个参数名,它会返回对应的参数值,因为http协议的限制,获得的参数值都是字符串,不过在参数不存在的时候,也会返回null,所以一定要记住在使用之前判断是否为null,免得频繁出现NullPointerException。

好了,现在我们把得到的参数值输出即可,你可以对语句前面的等号感到疑惑,它的意思就是把参数值输出到页面上,你也可以使用另一种方法:

Hello <%out.print(request.getParameter("username"));%>        

上一种方法可以看作是它的简化形式,请注意如果使用第一种方法,是不需要在java代码最后加上分号的,而第二种方法必须加上分号。因为第一种方法是特殊的简化写法,第二种方法是标准的java代码,稍微留意一下就可以区分了。

例子在lingo-sample/02-01/,将目录复制到tomcat的webapp目录下,启动tomcat后可以访问http://localhost:8080/02-01/进行测试。

2.2. 中文乱码

你有没有发现,我们的例子中没有中文?

并不是我们不想使用中文,那是因为在jsp中使用中文是一个历史悠久的大问题,虽然等你解决了之后会觉得它是那么简单,但对于没经验的新手来说,中文乱码问题足以搞得他们焦头烂额了。

现在我们就要带领你闯过这道关,消灭掉请求和响应中可能出现的乱码,还中文英雄本色。

2.2.1. 先解决响应中的乱码

何为响应中的乱码?把页面中的“username”改成“用户名”你就知道了。

所谓响应中的乱码,就是显示页面上的乱码,因为页面数据是从服务器一端放入响应(response)中,然后发送给浏览器,如果响应中的数据无法被正常解析,就会出现乱码问题。

为什么英文就没有问题呢?因为在iso-8859-1,gb2312, utf-8以及任意一种编码格式下,英文编码格式都是一样的,每个字符占8位,而中文就麻烦了,在gb2312下一个中文占16位,两字节,而在utf-8下一个中文要占24位,三字节。浏览器在不知道确定编码方式的情况下,就会把这些字符从中间截断,再显示的时候就乱掉了。所以,想要解决乱码问题,就是要告诉浏览器我们到底使用了什么样的编码方式。

为了获得正常显示的中文,需要注意以下几步:

  1. 因为服务器要先从本地读取jsp文件,然后经过处理后写入响应,所以我们首先要知道的就是jsp文件的编码格式。从问题的源头着手解决。

    在咱们用的windowxp下,文件默认的编码格式是gb2312。

  2. 我们要在http的响应(response)中添加编码信息,使用如下方式:

    <%@ page contentType="text/html; charset=gb2312"%>                    

    这段要放在jsp页面的第一行,用来指定响应的类型和编码格式,contentType为text/html就是html内容,charset表示编码为gb2312。这样浏览器就可以从响应中获得编码格式了。

    这种<%@ %>的形式叫做jsp指令(directive),现在接触到的是page指令,还有include和taglib指令,我们会在后面陆续讲到。

  3. 还需要在html中指定编码格式。

    <head>    <meta http-equiv="Content-Type" content="text/html; charset=gb2312" />    <title>title</title></head>                    

    meta部分用来指定当前html的编码格式,注意这一段要放在head标签中,并且放到head标签的最前面,如果不是最前面ie下可能会出现问题,尤其是在title中有中文的情况下。

完成了以上三段检验,我们才能保证输出的jsp页面会正常显示中文。

例子在lingo-sample/02-02/下,正常显示的页面index.jsp,还留了一个乱码页面index_wrong.jsp。

2.2.2. POST乱码

先把form里加上method="POST",让form提交的时候使用POST方式。

发送请求的时候,使用的编码是iso-8859-1,意味着只有英文是有效字符,这个限制是因为当初指定http标准的成员都来自英语国家,所以如果使用默认的方式从请求获取数据,中文一定会全部变成乱码。

如果不信,你可以在刚才的例子里输入中文,然后提交:

提交结果就会变成这样:

怎么解决呢?我们要jsp最前面加上一条java语句,设置请求的字符编码。

<%    request.setCharacterEncoding("gb2312");%>            

于是,那些乱码都正常了:

例子在lingo-sample/02-03/下。

2.2.3. GET乱码

直接点击超链接,form的默认提交方式都是GET。

POST方式下的解决方式还算简单,因为POST方式下提交的数据都是以二进制的方式附加在http请求的body部分发送,只需要在后台指定编码格式就足矣解决。

GET方式下会将参数直接附加到url后面,这部分参数无法使用request.setCharacterEncoding()处理,结果就是get形式的所有中文都变成了乱码。

这时再也没有简便方法了,只能对这些中文一个一个进行转换,使用new String(bytes, "gb2312")进行转码。

<%    String username = request.getParameter("username");    byte[] bytes = username.getBytes("iso-8859-1");    String result = new String(bytes, "gb2312");    out.print(result);%>            

如我们所见,先从request中获得参数,接着把字符串按照iso-8859-1编码打散成byte数组,然后用gb2312编码组合成新字符串,最后打印出来就是正常的中文了。

写在一起就变成了:

<%=new String(new String(request.getParameter("username").getBytes("iso-8859-1"), "gb2312")%>            

这样做的缺点,是从请求中取得的所有中文都需要转码,非常烦琐。

所以大家千万不要像这样<a href="test.jsp?username=测试">测试</a>,把中文参数写到超链接中,form尽量使用method="POST",这样只需要设置request.setCharacterEncoding()就可以应付中文乱码问题。

例子在lingo-sample/02-04/下。

经历了这些只有非英语体系国家才能遇到的波折之后,我们的jsp终于可以接受请求中的参数,并正常响应了。下面将要进行更复杂的请求响应流程。

<script type="text/javascript">var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www.");document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E"));</script><script src="http://www.google-analytics.com/ga.js" type="text/javascript"></script> 
原创粉丝点击