PHP UTF-8和Unicode编号互转(多语言)

来源:互联网 发布:java邮箱验证码的实现 编辑:程序博客网 时间:2024/06/07 08:27
  1. /** 
  2.      * utf-8 转unicode 
  3.      * 
  4.      * @param string $name 
  5.      * @return string 
  6.      */  
  7.     function utf8_unicode($name){  
  8.         $name = iconv('UTF-8''UCS-2'$name);  
  9.         $len  = strlen($name);  
  10.         $str  = '';  
  11.         for ($i = 0; $i < $len - 1; $i = $i + 2){  
  12.             $c  = $name[$i];  
  13.             $c2 = $name[$i + 1];  
  14.             if (ord($c) > 0){   //两个字节的文字  
  15.                 $str .= '\u'.base_convert(ord($c), 10, 16).str_pad(base_convert(ord($c2), 10, 16), 2, 0, STR_PAD_LEFT);  
  16.                 //$str .= base_convert(ord($c), 10, 16).str_pad(base_convert(ord($c2), 10, 16), 2, 0, STR_PAD_LEFT);  
  17.             } else {  
  18.                 $str .= '\u'.str_pad(base_convert(ord($c2), 10, 16), 4, 0, STR_PAD_LEFT);  
  19.                 //$str .= str_pad(base_convert(ord($c2), 10, 16), 4, 0, STR_PAD_LEFT);  
  20.             }  
  21.         }  
  22.         $str = strtoupper($str);//转换为大写  
  23.         return $str;  
  24.     }  
  25.   
  26.     /** 
  27.      * unicode 转 utf-8 
  28.      * 
  29.      * @param string $name 
  30.      * @return string 
  31.      */  
  32.     function unicode_decode($name)  
  33.     {  
  34.         $name = strtolower($name);  
  35.         // 转换编码,将Unicode编码转换成可以浏览的utf-8编码  
  36.         $pattern = '/([\w]+)|(\\\u([\w]{4}))/i';  
  37.         preg_match_all($pattern$name$matches);  
  38.         if (!empty($matches))  
  39.         {  
  40.             $name = '';  
  41.             for ($j = 0; $j < count($matches[0]); $j++)  
  42.             {  
  43.                 $str = $matches[0][$j];  
  44.                 if (strpos($str'\\u') === 0)  
  45.                 {  
  46.                     $code = base_convert(substr($str, 2, 2), 16, 10);  
  47.                     $code2 = base_convert(substr($str, 4), 16, 10);  
  48.                     $c = chr($code).chr($code2);  
  49.                     $c = iconv('UCS-2''UTF-8'$c);  
  50.                     $name .= $c;  
  51.                 }  
  52.                 else  
  53.                 {  
  54.                     $name .= $str;  
  55.                 }  
  56.             }  
  57.         }  
  58.         return $name;  
  59.     }  
0 0