python中汉字匹配

来源:互联网 发布:月球电影知乎 编辑:程序博客网 时间:2024/06/11 15:51

在python中要匹配汉字的话要转化为utf-8编码,汉字编码的范围在\u4e00-\u9fa5之内,就好比数字在0-9之内一样

之间,不说废话,具体看看怎么实现的把

import  retest="我是123周小旭,来自1bd江西ab九江"result=re.findall(ur'[\u4e00-\u9fa5]',test.decode('utf-8'))resultOut[35]: [u'\u6211', u'\u662f', u'\u5468', u'\u5c0f', u'\u65ed', u'\u6765', u'\u81ea', u'\u6c5f', u'\u897f', u'\u4e5d', u'\u6c5f']print ''.join(result)我是周小旭来自江西九江
result=re.findall(r'[0-9]',test)resultOut[42]: ['1', '2', '3', '1']
result=re.findall(r'[a-z]',test)resultOut[44]: ['b', 'd', 'a', 'b']




0 0
原创粉丝点击