批量把文本文档的GBK编码转化为UTF-8

来源:互联网 发布:手机自制音乐软件 编辑:程序博客网 时间:2024/04/30 10:09
package cwj.bbb;import java.io.*;import java.util.Collection;import org.apache.commons.io.FileUtils;/* * 批量把文本文档的GBK编码转化为UTF-8 * 使用用commons-io.jar实现文件的读取和写入 * */public class EncodeTest1 {public static void main(String[] args) throws IOException{String srcDirPath = "/home/cwjy1202/hadoop/旅游领域/旅游类测试文档/地方文化";//转为UTF-8编码格式源码路径。这个路径可以若不存在,会自动建立。String utf8DirPath = "/home/cwjy1202/hadoop/旅游领域/旅游类测试文档/地方文化1";      //获取所有txt文件Collection<File> javaGbkFileCol =  FileUtils.listFiles(new File(srcDirPath), new String[]{"txt"}, true);for (File javaGbkFile : javaGbkFileCol) {      //UTF8格式文件路径      String utf8FilePath = utf8DirPath+javaGbkFile.getAbsolutePath().substring(srcDirPath.length());       //使用GBK读取数据,然后用UTF-8写入数据      FileUtils.writeLines(new File(utf8FilePath), "UTF-8", FileUtils.readLines(javaGbkFile, "GBK"));       }}}

0 0