PHP中substr、mb_substr、mb_strcut这三个截取字符串函数的比较

来源:互联网 发布:淘宝珍珠内裤买家秀 编辑:程序博客网 时间:2024/04/26 07:06

一、函数说明

substr、mb_substr、mb_strcut这三个函数都用来截取字符串,所不同的是:

substr是最简单的截取,无法适应中文,截取中文会产生半个字符的现象,出现乱码;

mb_substr是按字符来切分字符串,截取中文不会产生半个字符的现象;

mb_strcut是按字节来切分字符串,截取中文不会产生半个字符的现象;

这三个函数的前三个参数完全一致,即:
第一个参数是操作对象,第二个参数是截取的起始位置,第三个参数是截取的数量;
mb_substr和mb_strcut还有第四个参数:第四个参数可以根据不同的字符集进行设置,譬如utf-8或者gbk。


二、代码示例

<?php//对待一个UTF8的中文字符是3个长度    //对待一个gbk的中文字符是2个长度    header("content-Type:text/html;charset=utf-8");       //设置内部编码    mb_internal_encoding('UTF-8');        //测试     $cn_str="钓鱼岛是中国的hehe";    $en_str="this is just a test";        //使用substr    echo substr($cn_str,0,3).'<br/>'; //钓  按照字节来截取echo substr($en_str,0,3).'<br/><br/>'; //thi 按照字节来截取    //使用mbsubstr()    echo "mb_substr-3: ".mb_substr($cn_str,0,3).'<br/>'; //钓鱼岛 按照字符来截取     echo "substr-3: ".substr($cn_str,0,3).'<br/>';//钓  按照字节来截取   echo "mb_strcut-3: ".mb_strcut($cn_str,0,3).'<br/><br/>'; //钓 按照字节来截取      echo "mb_substr-4:".mb_substr($cn_str,0,4).'<br/>';//钓鱼岛是  按照字符来截取  echo "substr-4:".substr($cn_str,0,4).'<br/>'; //钓?  按照字节来截取(出现乱码)      echo "mb_strcut-4:".mb_strcut($cn_str,0,4).'<br/><br/>'; //钓  按照字节来截取(不会出现乱码)    echo strlen($cn_str).'<br/>';   //25 = 3*7 + 4    按照字节来计算echo mb_strlen($cn_str).'<br/>';  //11 = 7 + 4    按照字符来计算echo iconv_strlen($cn_str).'<br/>';//25 = 3*7 + 4   按照字节来计算}

三、结论
        substr、mb_strcut表现都不够理想,mb_substr可以正常使用,但前提是要安装php扩展库,否则就要自己写一个适应各种情况的截取函数了。

0 0
原创粉丝点击