php多字节编码字符长度检测

来源:互联网 发布:女人之间的嫉妒知乎 编辑:程序博客网 时间:2024/06/06 07:17
/** *@bkInfo   1、 GB2312编码用两个字节(8位2进制)表示一个汉字 *           2、 GBK采用双字节表示,总体编码范围为8140-FEFE *           3、 Big5在台湾、香港与澳门地区,使用的是繁体中文字符集, *            1984年,台湾五大厂商宏碁、神通、佳佳、零壹以及大众一同制定了一种繁体中文编码方案, *            因其来源被称为五大码,英文写作Big5,每个字符统一使用两个字节存储表示 *           4、UTF-8对中文支持是一个汉字占3个字节 * @author   caifangjie * @date     2015-07-13 * @desc  多字节长度检测 *   */function mbLength($str){    $len = strlen($str);    $currentEncoding = strtolower(mb_detect_encoding($str));    $i=0;    for(;$i<$len;) {        //判断是否为多字节        if(ord(substr($str, $i, 1)) > 0xa0) {            if($currentEncoding == 'utf-8') {                $i=$i+3;            } else if(in_array($currentEncoding,array('gbk', 'gb2312', 'big5'))) {                $i=$i+2;            }        } else {           $i++;        }    }    return $i;}

0 0
原创粉丝点击