python电话 邮箱正则匹配清洗
来源:互联网 发布:linux怎么看硬盘空间 编辑:程序博客网 时间:2024/04/30 05:28
</pre>做数据清洗时候,难免会碰到有些客户电话,邮箱乱填写,一看就明显不正确,用到python写个正则表达式可以进行快速的清洗</p><p>废话不多说,上代码:</p><p><pre name="code" class="python">#encoding:utf-8'''Created on 2015年9月18日@author: ZHOUMEIXU204'''import MySQLdbimport reimport pandas as pdcon=MySQLdb.connect(host="10.10.109.62", port=1333, user="zhoumeixu204", \ passwd="zhoumeixu204@123456!", db="ubs", use_unicode=True, charset="utf8")result=pd.read_sql("SELECT cust_id , USR_MP,USR_EMAIL FROM ubs.usr_oper_info;",con)def mobile_match(x): pattern=re.compile(r'1[3,5,4,7,8]{1}[0-9]{9}') match=pattern.match(x) if match: return True else: return Falseresult['mobile_judge']=result['USR_MP'].map(mobile_match)def email_match(x): if x.strip().endswith('pingan.com.cn'): patten=re.compile(r'[a-zA-Z]{1,15}[0-9]{3}\@pingan\.com\.cn') match=patten.match(x) if match: return True else: return False else: if len(x) > 7: if re.match("^.+\\@(\\[?)[a-zA-Z0-9\\-\\.]+\\.([a-zA-Z]{2,3}|[0-9]{1,3})(\\]?)$", x) != None: return True else: return False else: return False result['usr_email_judge']=result['USR_EMAIL'].map(email_match)result.to_excel(u"D:\\匹配结果.xls",index=False)print(result.head())con.close()
实际都是一些技巧,记录一些,免得要用时候又要查找
0 0
- python电话 邮箱正则匹配清洗
- 正则匹配电话、QQ、邮箱
- JS正则座机电话和邮箱匹配
- JS正则匹配手机,电话,邮箱,URL
- python正则表达式匹配邮箱
- 在Python中使用正则表达式同时匹配邮箱和电话并进行简单的分类
- php 正则匹配电话号手机号邮箱网址
- 正则表达式匹配身份证 电话号码 邮箱 住宅电话 邮编等
- 正则表达式匹配身份证 电话号码 邮箱 住宅电话 邮编等
- python 正则匹配电话与ip
- 电话,手机,邮箱 正则
- Java邮箱正则匹配
- 匹配邮箱正则表达式
- 正则表达式匹配邮箱
- 正则表达式匹配邮箱
- 邮箱跟电话正则验证
- Python 正则表达式(5)电话号匹配
- Python-同时匹配邮箱和电话号码的正则表达式
- UIGestureRecognizer 手势识别器
- android 与servlet json数据交互
- ios 下创建,删除文件夹的方法
- Android Studio 模拟器对应键盘快捷键映射
- windows下Qt5.4.2 for android开发环境配置
- python电话 邮箱正则匹配清洗
- UITextField 输入框
- Document Your Process, Then Make Sure It Is Followed
- Mybatis(ibatis)的一对多关联配置
- ARM外设flash及SDRAM的地址连接
- Java正则表达式
- linux下tty,控制台,虚拟终端,串口,console(控制台终端)详解
- ShaderLab Tutorials-Additive Vert Color Blend
- Go Ahead, Throw That Practice Out