PHP UTF-8编码问题

来源:互联网 发布:房地产网络推广方案 编辑:程序博客网 时间:2024/06/05 04:01

一、PHP文件里面要说明

<meta http-equiv="Content-Type" Content="text/html;charset=utf-8">

或者

<?php header('Content-Type:text/html;charset=utf-8');?>

还有就是处理中文等双字节的时候也有可能出现乱码,PHP里面可以采用的有iconv,mb_convert_encoding来处理双字节,其余的可以参考PHP帮助手。
二、生成的HTML文件添加以下信息
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "
http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">
<html xmlns="
http://www.w3.org/1999/xhtml" xml:lang="UTF-8" lang="UTF-8">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="Content-Language" content="UTF-8" />
……

</head>

</html>

三、文件编码问题

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,
如果是ANSI,需要将编码改成:UTF-8。
1、文件头BOM问题:
将文件从其他的编码转换成UTF-8编码时,有时候会在文件的最开始加上一个BOM标签,这个BOM标签可能会导致浏览器在显示中文的时候出现乱码。特别注意:PHP文件一定不可以有BOM标签,否则,会出现session不能使用的情况,并有类似的提示:
Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent
这是因为,在执行session_start() 的时候,整个页面不能有输出,但是当由于前PHP页面存在BOM标签,PHP把这个BOM标签当成是输出了,所以就出错了!所以PHP页面一定要删除BOM标签。
a.可以用Dreamweaver打开文件,并重新保存,即可以去除BOM标签!
b.可以用EditPlus打开文件,并在菜单“首选项”->“文件”->"UTF-8标识",设置为:“总是删除签名”,然后保存文件,即可以去除BOM标签!
c.WEB服务器UTF-8编码问题:
如果你按以上所列的步骤做了,还是有中文乱码问题,
请检查你的所使用的WEB服务器的编码问题
如果你使用的是Apache,请将配置文件里的:charset 设成:utf-8(这里仅列出方法,具体格式请参考apache的配置文件)
如果你使用的是Nginx,请将nginx.conf里的:charset 设成 utf-8,
具体找到 "charset gb2312;"或者类似的语句,改成:“charset utf-8;”。

2、PHP以附件形式保存文件的时候,UTF-8编码问题:
PHP以附件形式保存文件,文件名必须是GB2312编码,否则,如果文件名中有中文的话,将是显示乱码;如果你的PHP本身是UTF-8编码格式的文件,需要将文件名变量由UTF-8转成GB2312:
iconv("UTF-8", "GB2312", "$filename");

3、截断显示文章标题时,出现乱码或者“?”问号的问题:
一般文章标题很长的时候,会显示一部分标题,会对文章标题进行截断,由于一个UTF-8编码格式的中文字符会占用3个字符宽度,截取标题的时候,有时会只截取到一个中文字符的1个字符或2字符宽度,没截取完整,将出现乱码或“?”问号的情况,用下面的函数截取标题,就不会有问题:

functionget_brief_str($str, $max_length)
 
{
 
echo strlen($str) ."<br>";
if
(strlen($str)> $max_length)
 
{
 $check_num=
0;
for
($i=0; $i< $max_length; $i++)
 
{
if
(ord($str[$i])>128)
 
$check_num++;
 }

if($check_num% 3 ==
0)
 
$str=
substr($str,0, $max_length)."...";
else if($check_num%3 ==
1)
 
$str= substr($str,0, $max_length+
2)."...";
else if($check_num%3 ==
2)
 
$str= substr($str,0, $max_length+
1)."...";
 
}
return
$str;
 
}

 

四、在建数据库,尤其是用phpMyAdmin与MYSQL打交道时候,一般都是utf-8,字段为 utf8_general_ci

数据库的设置:

在my.ini文件中查找:

[mysql]
default-character-set = utf8

[mysqld]

default-character-set = utf8

default-storage-engine=MyISAM

在[mysqld]下加入

default-collation=utf8_bin

init_connect = 'SET NAMES utf8 '

全部设置为utf8保存,重新启动mysql服务

另外,在需要做数据库操作的php程序前加: mysql_query("set names '编码'"); 编码和php编码一致,如果php编码是gb2312,那mysql编码就是gb2312;如果是utf-8,那mysql编码就是utf8。【注意是:utf8,不是 utf-8】


按照以上要求,就可以PHP正常支持UTF-8编码了.