数据查重去重,数据匹配过程

来源:互联网 发布:泽野螳螂 知乎 编辑:程序博客网 时间:2024/05/30 23:17

帮助更多需要自动化解决工作的人们。

步骤:不完整,重复,错误,格式不规范数据 -> 数据清洗 -> 正确规范数据 -> 数据去重技术 -> 数据匹配。

使用过的一些相关软件,查看它们各自的缺陷:

缺陷:1.人工干预多; 2.数据率(数据质量)不高; 3.过于依赖地址,电话信息。

维护:数据在不断使用和变化的过程中,如果不维护,数据质量会不断下降(数据重复,格式不一致问题)。-> 数据清理,数据匹配,数据查重

0 0