使用PHP批量去除文件UTF8 BOM信息

来源:互联网 发布:小熊软件下载 编辑:程序博客网 时间:2024/05/18 10:47
原理:
UTF8文件,微软为了增加一个识别信息,有了BOM这个东西:BOM —— Byte Order Mark,缺省在Windows等平台上编辑的UTF8文件会在头部增加3个字节的标记信息,我们PHP引擎在处理的时候会完整读取整个PHP代码文档, 如果PHP文件头部包含BOM信息,就会输出一个空白,在很多时候会带来问题,比如我们session无法工作、cookie无法设置等等问题。

解决方法:
把头部BOM的3个字节信息识别出来,然后剔除掉。不过一般情况我们不知道哪个文件有BOM,或者是有很多文件,这个时候,就需要进行批量处理了,下面代码主要就是展现了批量处理的情况,应该会对大家工作中有帮助。


执行方法:
设置一个路径,然后直接执行就行。
//===================== 代码开始 =========================<?php // 设定你要清除BOM的根目录(会自动扫描所有子目录和文件)$HOME = dirname(__FILE__);// 如果是Windows系统,修改为:$WIN = 1;$WIN = 0;?><!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8" /><title>UTF8 BOM 清除器</title><style>body { font-size: 10px; font-family: Arial, Helvetica, sans-serif; background: #FFF; color: #000; }.FOUND { color: #F30; font-size: 14px; font-weight: bold; }</style></head><body><?php$BOMBED = array();RecursiveFolder($HOME);echo '<h2>These files had UTF8 BOM, but i cleaned them:</h2><p class="FOUND">';foreach ($BOMBED as $utf) { echo $utf ."<br />\n"; }echo '</p>';// 递归扫描function RecursiveFolder($sHOME) { global $BOMBED, $WIN; $win32 = ($WIN == 1) ? "\\" : "/"; $folder = dir($sHOME); $foundfolders = array(); while ($file = $folder->read()) {  if($file != "." and $file != "..") {   if(filetype($sHOME . $win32 . $file) == "dir"){    $foundfolders[count($foundfolders)] = $sHOME . $win32 . $file;   } else {    $content = file_get_contents($sHOME . $win32 . $file);    $BOM = SearchBOM($content);    if ($BOM) {     $BOMBED[count($BOMBED)] = $sHOME . $win32 . $file;     // 移出BOM信息     $content = substr($content,3);     // 写回到原始文件     file_put_contents($sHOME . $win32 . $file, $content);    }   }  } } $folder->close(); if(count($foundfolders) > 0) {  foreach ($foundfolders as $folder) {   RecursiveFolder($folder, $win32);  } }}// 搜索当前文件是否有BOMfunction SearchBOM($string) {   if(substr($string,0,3) == pack("CCC",0xef,0xbb,0xbf)) return true;  return false; }?></body></html>//===================== 代码结束 ===========================
原文地址:http://www.54xue.com/w/66/n-31866.html

原创粉丝点击