网页post和get方法中的中文乱码问题详解

来源:互联网 发布:java获取泛型t的class 编辑:程序博客网 时间:2024/05/16 01:15
1. gb2312、gbk、iso8859-1、utf8
    面对中文乱码的时候首先要解决为什么会乱码?乱码的本质是用来解码的方式不对,而且乱码一般只会出现在中文等语言中。我们常见的就是标题中的四种编码,这四种编码的区别和历史可以自己百度,这里不再赘述。在实际使用的时候,gbk可以兼容gb2312和iso8859-1,因此如果你html页面上用的是gb2312或者iso8859-1,那么后台就可以直接用gbk去解码。

2、解码思想
    中文参数编码、解码的流程如下:
    中文参数---->以A方式编码---->浏览器以B方式编码将信息发送到后台---->后台以C方式解码,在这个过程中,A、B、C编码方式有任何一个不统一的就会产生乱码。一般我们解码都是在后台解码,也就是将C编码方式和A、B统一起来。
    2.1post和get的区别
        post方式中浏览器会以页面编码的方式将信息传递出去,也就是说在post方式中A和B一定是统一的。因此在post方式中我们在后台                 用request.setCharacterEncoding("编码方式")方法将参数进行统一的解码就行了。
        比如网页编码如下:

    那么后台解码就可以这样:
        get方式和post不同的地方在于不论网页使用什么编码的,浏览器都会使用默认的iso8850-1编码方式将信息发送到后台,因此流程中A和B是不一定统一的。不过这其中的B编码方式已经确定了是iso8859-1,所以我们可以先取得传递过来的参数,然后用iso8859-1解码,然后再使用网页编码方式A进行解码。(网页编码使用的肯定不会是iso8859-1,因为iso8859-1是无法解析中文的)。你必须先用iso8859-1解码,否则不能解码成功,使用get方式提交的中文相当于加密了两次。
        比如网页如下:
        解码如下:



1 0
原创粉丝点击