UTF-8 BOM导致验证码不显示

来源:互联网 发布:奇葩说颜如晶人工智能 编辑:程序博客网 时间:2024/06/04 17:51

在用php做验证码的时候,遇到一个很奇怪的问题:生成的验证码图片只显示红叉。以为是自己写的代码有误,就下载了多个版本的代码测试,没想到结果都一样。
于是去网上搜索解决方案,发现遇到这个问题的人还不少。大多都是说,因为没有正确安装配置好GD库,要把php.ini文件 ;extension=php_gd2.dll 这行前面的分号去掉。但是我打开php.ini文件,这行的注释已经去掉了,并且通过phpinfo()查看到GD库也是开启的。这样,就更觉得这个问题奇怪又恼人了。

后来有同事提醒,会不会是因为编码的问题。然后就试着把文件以不同的编码方式保存,最后当把文件保存为” UTF-8 BOM”格式,验证码图片终于正常显示了。于是就迫切地搜关于BOM的资料:
///////////////////////////////////////////////////////////////////////////////////////

BOM(Byte Order Mark)就是字节序标记。在UCS(Unicode Character Set) 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE(零宽度无断空白)"的字符,它的编码是FEFF。而FFFEUCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的;如果收到FFFE,就表明这个字节流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOMUTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"UTF-8编码是EF BB BF。所以如果接收者收到以EF BB BF开头的字节流,就知道这是UTF-8编码了。Windows就是使用BOM来标记文本文件的编码方式的。当以UTF-16UTF-32来将UCS所组成的字串编码时,这个字符被用来标示其字节序。它常被用来当做标示文件是以UTF-8UTF-16UTF-32编码的记号。
///////////////////////////////////////////////////////////////////////////////////////

总算弄明白怎么回事了。发送header前不能有任何的输出!

我是用UltraEdit来编辑PHP的,在UltraEdit新建的文件,如果文件中有中文字符,保存时会在文件中写入BOM信息。一般情况下,这样并不会出什么问题,但PHP4,5都是不支持BOM的。

在使用header()setcookie()session_start()这三个函数时, 都要求在使用前不能对浏览器有任何输出。由于受COOKIE送出机制的限制,在有BOM的文件中,COOKIE无法送出,因为在COOKIE送出前PHP已经送出了文件头。

如果在处理PHP文件后出现以下问题,多半是因为这个原因:
        * 验证码图片不显示;
        * 页面显示一个“锘”字,其他一片空白;
        * 不能登入或登出;
        * 页顶出现一行空白;
        * 页顶出现错误警告。

为了解决这个问题花了不少时间,老费劲了,所以很慎重地记录下来。

原创粉丝点击