编码问题 gb2312 utf-8

来源:互联网 发布:先入为主知乎 编辑:程序博客网 时间:2024/04/30 04:01

 有时看到网址中出现一些百分号和字母数字组成的怪异的编码,其实它是一种特殊的编码,由于有些设备上只能传送128个 ASCll  码,不认识汉字,所以为了兼容性必须转换成这种特殊的字符编码,百分号后的字母和数字就是十六进制数字。

如果是中文 gb2312 编码的话,那么两组 %xx  对应一个汉字, 即: %xx%xx    
例如这个网址:http://www.baidu.com/baidu?tn=baidu&word=%C9%E8%BC%C6 
其中的 %C9%E8%BC%C6  就对应“设计”两个字。

如果是 utf-8 编码的话,那么三组 %xx  对应一个汉字, 即:%xx%xx%xx  
如:http://www.google.cn/search?complete=1&hl=zh-CN&newwindow=1&q=%E8%AE%BE%E8%AE%A1&aq=f&oq=  
其中 %E8%AE%BE%E8%AE%A1  对应设计两个字。

 

同理,如果你有串这种编码希望解码为汉字的也话很简单,只需要借用以上网址在浏览器里输入,然后用你的编码来替换相应的编码就行了,注意 gb2312 用上面百度的网址,utf-8 就用 google 的网址,点搜索,解码后的汉字就会出现在页面中的搜索框里了。

当然还有更简单的网址,至于哪个是用的 gb2312 或是 utf-8 自己试一下便知:

http://www.google.cn/search?q=
http://www.baidu.com/s?wd=


原创粉丝点击