GBK源码转UTF8

来源:互联网 发布:淘宝号点数查询 编辑:程序博客网 时间:2024/05/20 00:38

最近在做一个项目,需要从以前的另外一个项目迁移大量源代码过来,但是由于另一个项目采用GBK编码格式,而新项目采用的UTF-8编码格式,如果直接把Java源代码复制到Eclipse中所有的中文信息都出现乱码。

将文本文件的编码格式从GBK转UTF-8的方式有很多,比较早以前我处理方式都是自己写程序,从文本文件中用GBK编码读取数据,转为String类型,然后通过UTF-8编码重新写入文本文件实现转码,现在经常使用 Apache Common 组件,用commons-io.jar实现文件的读取和写入,代码如下:

(commons-io 下载见:http://commons.apache.org/io/download_io.cgi)

//GBK编码格式源码路径 
String srcDirPath = "D:\\dev\\workspace\\masdev\\mas\\src"; 
//转为UTF-8编码格式源码路径 
String utf8DirPath = "D:\\UTF8\\src"; 
        
//获取所有java文件 
Collection<File> javaGbkFileCol =  FileUtils.listFiles(new File(srcDirPath), new String[]{"java"}, true); 
        
for (File javaGbkFile : javaGbkFileCol) { 
      //UTF8格式文件路径 
      String utf8FilePath = utf8DirPath+javaGbkFile.getAbsolutePath().substring(srcDirPath.length()); 
       //使用GBK读取数据,然后用UTF-8写入数据 
      FileUtils.writeLines(new File(utf8FilePath), "UTF-8", FileUtils.readLines(javaGbkFile, "GBK"));        
}

很简单的几行代码,就可以批量将GBK格式的java文件转为UTF-8格式。 基本上所有文本文件的编码转换都可以采用这种方式。

工程文件见:http://www.oschina.net/code/snippet_97118_11332


原创粉丝点击