python 利用正则过滤表情符号

来源:互联网 发布:淘宝服装店铺策划书 编辑:程序博客网 时间:2024/05/19 04:26

mysql在插入数据库的时候,在有表情符号的情况下,经常会报数据类型不符的错误,

表情符号常常在于手机端一些用户名称和会话中出现,一般情况下把数据库utf8改成utf8mb4就没有问题了可以正常上传

但是不排除即便更改,也无法上传的情况,所以在此,分享下如何用python将表情符号过滤


import re

引入re模块,Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作



highpoints = re.compile(u'[\uD800-\uDBFF][\uDC00-\uDFFF]')

在这里定义正则,highpoints为顶以后的正则


nickname = highpoints.sub(u'', testdata)

nickname就是最后得到的没有表情的数据,testdata是源数据,我们把源数据中的表情替换为空了


import re
0 0
原创粉丝点击