BOM(byte-order mark):字节顺序标记
来源:互联网 发布:ff14高地男捏脸数据 编辑:程序博客网 时间:2024/06/06 02:29
什么是BOM
BOM(byte-order mark),即字节顺序标记,它是插入到以UTF-8、UTF16或UTF-32编码Unicode文件开头的特殊标记,用来识别Unicode文件的编码类型。对于UTF-8来说,BOM并不是必须的,因为BOM用来标记多字节编码文件的编码类型和字节顺序(big-endian或little-endian)。
在绝大多数编辑器中都看不到BOM字符,因为它们能理解Unicode,去掉了读取器看不到的题头信息。若要查看某个Unicode文件是否以BOM开头,可以使用十六进制编辑器。下表列出了不同编码所对应的BOM。
BOM Encoding
EF BB BF UTF-8
FE FF UTF-16 (big-endian)
FF FE UTF-16 (little-endian)
00 00 FE FF UTF-32 (big-endian)
FF FE 00 00 UTF-32 (little-endian)
BOM的来历
为了识别 Unicode 文件,Microsoft 建议所有的 Unicode 文件应该以 ZERO WIDTH NOBREAK SPACE(U+FEFF)字符开头。这作为一个“特征符”或“字节顺序标记(byte-order mark,BOM)”来识别文件中使用的编码和字节顺序。
Linux/UNIX 并没有使用 BOM,因为它会破坏现有的 ASCII 文件的语法约定。
不同的编辑工具对BOM的处理也各不相同。使用Windows自带的记事本将文件保存为UTF-8编码的时候,记事本会自动在文件开头插入BOM(虽然BOM对UTF-8来说并不是必须的),但是editplus就不会这样做。
转载自:http://en.wikipedia.org/wiki/Byte_order_mark
- BOM(byte-order mark):字节顺序标记
- Byte Order Mark - BOM
- BOM(Byte Order Mark)
- Byte order mark (BOM)
- A byte order mark (BOM)
- BOM(Byte-order Mark)
- 什么是BOM(byte-order mark)
- BOM(byte-order mark)
- 字节顺序(byte order)
- 字节顺序(byte order)
- 该死的BOM(byte-order mark)
- 什么是BOM(byte-order mark)(转贴)
- 什么是BOM(Byte Order Mark)?
- 文本 字节顺序标记(BOM)
- 字节顺序(Byte Order)
- UTF-8文件的Unicode签名BOM(Byte Order Mark)
- Vim 和 utf-8 bom 头(Byte Order Mark)
- (转)PHP与Unicode签名(BOM,Byte Order Mark)
- u-boot-2016.09移植(6)-dm9000
- c语言编写,2/1,3/2,5/3,8/5....这个数列的前20 项和
- filter过滤筛选
- 【封装】Fragment切换的方法
- mybatis报错:A query was run and no Result Maps were found for the Mapped Statement
- BOM(byte-order mark):字节顺序标记
- JDBC
- 第十周 小学生百以内算术考试系统
- nyoj 303 序号互换 第四届河南省赛
- C++_STL_数据结构_stack_栈
- LeetCode 第四十五题(Jump Game II)Java
- hashmap 死循环解析
- python signal handling
- 通知的各种实用写法技巧