信贷数据的处理

来源:互联网 发布:plug2view软件下载 编辑:程序博客网 时间:2024/04/27 21:23

要实现好的风控,前提:

  要保证数据的质量

数据质量:不仅要看数据源,数据的清洗更为重要。

数据的清洗标准流程:1.数据质量的判断

2.做衍生变量(目前我在做的地方)

3.加工、清理

这几个要求非常严谨

这一块没有做好,在厉害的算法都没有意义!

目前我们信贷:评分、产品优选、额度计算器等都传入  强相关与弱相关变量 

组装的变量有  :借贷人基本信息包括配偶、亲属(2人)、非亲属信息(3人),关注检测信息、黑名单(客户、客户经理、渠道)、征信报告信息(强相关变量)、第三方数据防止欺诈(汇法、同盾、宜信致诚)、现场调查数据、电话核查数据、人脸识别(通过身份证上面的照片与现场采集的照片进行比对  相似度60%)等,具体 业务的否决,通过,统一通过  政策服务(Fico)

原创粉丝点击