Linux下utf-8 BOM 的检查和删除

来源:互联网 发布:好精彩网络机顶盒 编辑:程序博客网 时间:2024/05/16 16:04
1、当源程序是gb格式,你转换为 utf8 的时候,很多情况是头部会出现bom,当是php 程序时候,
这样会出现很多意想不到的事情,那怎么办呢,你可以用linux 命令来查找,然后对文件的bom 进行删除,就ok 了


grep -r $’xEFxBBxBF’ * |grep .php
bom:UTF-8签名(UTF-8 signature)也叫做BOM(Byte Order Mark)


用vim去除utf-8 BOM


1.’去掉utf-8 BOM


:set nobomb


2.’保留utf-8 BOM


:set bomb


2、Windows记事本编辑UTF-8 编码文件时会在文件头上加上三个字节的BOM:EFBBBF。如果fileencodings中设置ucs-bom的
目的就是为了能够兼容用记事本编辑的 文件,不需要的话可以去掉。Vim在保存UTF-8编码的文件时会去掉BOM。
去掉BOM的最大好处是在Unix下能够使用cat a b>c来正确合并文件,这点经常被忽略。