文本 字节顺序标记(BOM)

来源:互联网 发布:摩擦纳米发电机 知乎 编辑:程序博客网 时间:2024/06/05 06:32

BOM(Byte Order Mark),字节顺序标记,出现在文本文件头部,Unicode编码标准中用于标识文件是采用哪种格式的编码。
UTF-8 不需要 BOM 来表明字节顺序,但可以用 BOM 来表明编码方式。字符 “Zero Width No-Break Space” 的 UTF-8 编码是 EF BB BF。所以如果接收者收到以 EF BB BF 开头的字节流,就知道这是 UTF-8编码了。Windows 就是使用 BOM 来标记文本文件的编码方式的。类似WINDOWS自带的记事本等软件,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。

UTF8带BOM
这里写图片描述
UTF8不带BOM
这里写图片描述

处理程序若是不带BOM 处理可能导致问题。

参考:
百度百科 BOM

0 0
原创粉丝点击