PHP正则匹配特定中文

来源:互联网 发布:java main执行 编辑:程序博客网 时间:2024/05/18 01:22

PHP的正则匹配中文一直比较麻烦,要将汉字转化为内码才能匹配得到。这段时间需要用到这方面的东西,但是在网上找不到这方面的资料。所以不得不自己去研究,经过一番摸索。终于实现了特定中文的匹配。 废话少说,直接上代码:

<?PHP
          $html="这是汉字";
          preg_match_all("/\xba\xba\xd7\xd6/",$html,$match);
          print_r($match);
?>

上面的例子匹配了“汉字”两个字。其中每个汉字用两个16进制数表示。至于这两个数字怎么来的。大家可以在这里查到http://ff.163.com/newflyff/gbk-list/

比如“汉”字

大家可以看到他的区码为BA ,位码也是BA

而“字”字

则为d7 d6所以便有了上面的正则