Java默认字符编码

来源:互联网 发布:浙江省高等教育网络 编辑:程序博客网 时间:2024/06/04 18:39

大家都说java使用的字符集是unicode,那么默认编码不就是应该是UTF8,UTF16之类的unicode编码吗?

可是调用Charset.defaultCharset()的结果并非如此。

[java:showcolumns] view plaincopyprint?
  1. import java.nio.charset.Charset;  
  2.   
  3. public class javaCode {  
  4.     public static void main(String args[])  
  5.     {  
  6.         String defaultCharsetName=Charset.defaultCharset().displayName();   
  7.         System.out.println("defaultCharsetName:"+defaultCharsetName);  
  8.           
  9.     }  
  10. }  


执行结果如下

defaultCharsetName:GBK

多次试验发现,这个默认字符编码是由windows的语言地域里的设定决定的

语言设定


 

 这个字符编码肯定不是java内部的字符编码,那会不会是文件读入时的字符编码?

先用Emeditor之类的编辑器,生成一个UTF8的txt文件,输入内容:門(door),保存。

用下面的代码读入

[java:showcolumns] view plaincopyprint?
  1. import java.io.FileInputStream;  
  2. import java.io.FileNotFoundException;  
  3. import java.io.IOException;  
  4. import java.io.InputStream;  
  5. import java.io.InputStreamReader;  
  6. import java.nio.charset.Charset;  
  7.   
  8. public class javaCode {  
  9.     public static void main(String args[])  
  10.     {  
  11.         String defaultCharsetName=Charset.defaultCharset().displayName();   
  12.         System.out.println("defaultCharsetName:"+defaultCharsetName);  
  13.         try {  
  14.             InputStream is = new FileInputStream("F://shifjst.txt");  
  15.             //等于 InputStreamReader streamReader = new InputStreamReader(is,Charset.defaultCharset());  
  16.             InputStreamReader streamReader = new InputStreamReader(is);  
  17.             char[] chars = new char[10];  
  18.             streamReader.read(chars, 010);  
  19.             System.out.println(chars);  
  20.         } catch (FileNotFoundException e) {  
  21.             // TODO Auto-generated catch block  
  22.             e.printStackTrace();  
  23.         } catch (IOException e) {  
  24.             // TODO Auto-generated catch block  
  25.             e.printStackTrace();  
  26.         }  
  27.           
  28.     }  
  29. }  


 

结果是乱码:

defaultCharsetName:windows-31j
髢?door)

再把那个文件的格式改成shift-jis,正确读出来了。

defaultCharsetName:windows-31j
門(door)

看来,java读入文件时的字符编码是根据系统的默认编码来的。