java解析utf-8文件

来源:互联网 发布:政府 阿里云 安全 编辑:程序博客网 时间:2024/06/03 17:53

解析utf-8格式的文件时,注意有读取第一个字符串进行比较时可能会出现两个字符串看起来相同,但是equals结果为false的情况。

原因:utf-8有两种格式

1)有签名(前三个字节为BOM)所以读取字符串时应该注意这三个字节的存在,应该使用字节流先看一先前面三个字节。

2)无签名   可以按照正常的方式解析


0 0
原创粉丝点击