备忘:几种中文乱码处理转码情况

来源:互联网 发布:人工智能7大应用领域 编辑:程序博客网 时间:2024/06/06 09:22

备忘:几种中文乱码处理转码情况

 

 

 

 

一般中文转码情况如下:
public class HelloWorld {
      public static void main(String[] argv){
         try{
           System.out.println("中文");//1
           System.out.println("中文".getBytes());//2
           System.out.println("中文".getBytes("GB2312"));//3
           System.out.println("中文".getBytes("ISO8859-1"));//4
           System.out.println(new String("中文".getBytes()));//5
           System.out.println(new String("中文".getBytes(),"GB2312"));//6
           System.out.println(new String("中文".getBytes(),"ISO8859-1"));//7
           System.out.println(new String("中文".getBytes("GB2312")));//8
           System.out.println(new String("中文".getBytes("GB2312"),"GB2312"));//9
           System.out.println(new String("中文".getBytes("GB2312"),"ISO8859-1"));//10
           System.out.println(new String("中文".getBytes("ISO8859-1")));//11
           System.out.println(new String("中文".getBytes("ISO8859-1"),"GB2312"));//12
           System.out.println(new String("中文".getBytes("ISO8859-1"),"ISO8859-1"));//13
         }
         catch(Exception e){
           e.printStackTrace();
         }
       }
}


js中escape,encodeURI,encodeURIComponent三个函数的区别
js对文字进行编码涉及3个函数:escape,encodeURI,encodeURIComponent,相应3个解码函数:

unescape,decodeURI,decodeURIComponent

1、
传递参数时需要使用encodeURIComponent,这样组合的url才不会被#等特殊字符截断。                           

例如:<script language="javascript">
 document.write('<a href="http://passport.baidu.com/?logout&aid=7&u='+encodeURIComponent 

("http://cang.baidu.com/bruce42")+'">退出</a>');
</script>

2、
进行url跳转时可以整体使用encodeURI

例如:Location.href=encodeURI("http://cang.baidu.com/do/s?word=百度&ct=21");

3、
js使用数据时可以使用escape

[Huoho.Com编辑]
例如:搜藏中history纪录。

4、
escape对0-255以外的unicode值进行编码时输出%u****格式,其它情况下escape,encodeURI,encodeURIComponent编码结果

相同。


最多使用的应为encodeURIComponent,它是将中文、韩文等特殊字符转换成utf-8格式的url编码,所以如果给后台传递参数

需要使用encodeURIComponent时需要后台解码对utf-8支持(form中的编码方式和当前页面编码方式相同)

escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z

encodeURI不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z

encodeURIComponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z

 

 

 

原创粉丝点击