正则提取编码解码问题

来源:互联网 发布:平安银行网络贷款 编辑:程序博客网 时间:2024/05/15 05:42

p = re.compile(u'《(.*?)》') # 使用unicode编码

vid_drama_list = p.findall(info_util.get_id_field(vid,"name_cn").decode("utf8"))# utf8解码为unicode

vid_drama_list = [x.encode("utf8") for x in vid_drama_list]# unicode再编码为utf8,防止输出乱码。

注意:

pattern和string中,都需要使用unicode,否则编码不同,结果有误(如:《推拿》,《一切都好》等)。

0 0
原创粉丝点击