如何测试文件或字符串的编码?
来源:互联网 发布:最好的移动硬盘盒 知乎 编辑:程序博客网 时间:2024/05/04 04:58
由于程序需要导入一些文本文件,所以碰到文件编码问题。原来想输入的文本文件都用utf-8编码格式问题就解决了,但是后来发现,需要导入的文件,是由第三方来提供的,格式我们控制不了,所以在导入前需要检测文件的编码,然后根据编码来读入,以避免乱码问题。
经过一番查找,发现用现成的第三方jar包比较简单、可靠。需要的jar包:cpdetector_1.0.8.jar,另外需要依赖antlr-2.7.2.jar和chardet.jar包,网上下载地址很多,就不上传了。
测试文件编码:
import info.monitorenter.cpdetector.io.CodepageDetectorProxy;
import info.monitorenter.cpdetector.io.ParsingDetector;
import info.monitorenter.cpdetector.io.JChardetFacade;
import info.monitorenter.cpdetector.io.ASCIIDetector;
import info.monitorenter.cpdetector.io.UnicodeDetector;
String chartsetName;
//获取文件编码格式
CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();
detector.add(new ParsingDetector(false));
detector.add(JChardetFacade.getInstance());
detector.add(ASCIIDetector.getInstance());
detector.add(UnicodeDetector.getInstance());
java.nio.charset.Charset charset = null;
try {
charset = detector.detectCodepage(sourseFile.toURL());
} catch (Exception ex) {
ex.printStackTrace();
}
if (charset != null) {
chartsetName=charset.name();
} else {
chartsetName="UTF-8";
}
//获取编码后按编码格式读取文件
BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(fileName),chartsetName));
while (in.ready()) {
str = in.readLine().trim();
... ...
}
如果测试输入的文本流的格式,可以如下:
charset=detector.detectCodepage(InputStream in, int length);
可以用下面代码获得Java支持编码集合:
Charset.availableCharsets().keySet();
可以用下面的代码获得系统默认编码:
Charset.defaultCharset();
- 如何测试文件或字符串的编码?
- 如何使用Java代码获取文件、文件流或字符串的编码方式
- PHP 获取文件 或 字符串的编码方式 mb_detect_encoding()
- 2 如何解析XML文件或字符串
- 主题:判定文件编码或文本流编码的方法
- 主题:判定文件编码或文本流编码的方法
- 判定文件编码或文本流编码的方法
- python字符串编码测试
- 一个可序列化的C#对象,如何转成一个XML格式的文件或字符串
- cpp如何快速安全地将文件读入字符串string或字符数组vector<string>的方法
- 如何输出一个某种编码的字符串?
- 如何编码?(简单字符串的模拟)
- HTML::Entities 编码或解码 HTML 实体的字符串
- 识别文件或者字符串的编码
- delphi中取得文件编码,字符串编码的方法
- 文件字符串编码警告
- 测试过程中,如何改变python的工作目录,并引用新目录下的其他模块或文件
- 用EditPlus查看或修改文件编码的方法
- Java读取文件方法大全
- 深入Java核心 Java内存分配原理精讲
- android短信监听工具
- jquery 添加插入元素技巧
- Ubuntu设置PATH全局有效
- 如何测试文件或字符串的编码?
- 函数指针—指针函数 数组指针—指针数组 类模板—模板类 函数模板——模板函数 的区别
- 查询Oracle正在执行的SQL语句
- 无法访问,文件或目录损坏且无法读取"的解决方
- vb、asp和html中调用c#类库的详细步骤了截图
- Conquer English 成功征服英语20个好习惯
- tabHost研究二——利用Radiobutton嵌套在RadioGroup实现TabHost效果
- CEGUI与DX(Direct3D)渲染的冲突问题
- 安装subclipse, MyEclipse8.5 SVN插件