信用评分模型

来源:互联网 发布:淘宝网货到付款 编辑:程序博客网 时间:2024/04/30 07:46

逻辑回归模型:广泛应用在申请评分、行为评分、市场响应、客户流失等建模领域。

决策树模型:往往被用来做催收评分和客户盈利模型。

神经网络模型:用来防止申请和交易欺诈。

信用评分的主要目的是估计消费者的信用情况(正常或违约),具体做法是根据酷虎的历史信息资料,利用合适的数学统计模型,得到消费者违约的概率值。

客户的信息资料:人口统计学数据(性别、年龄、婚姻、收入、住房、居民、教育、种族、子女)、客户行为信息(交易记录、产品所有和使用记录)、征信机构的数据和评分

信用评分的步骤:

(1)业务理解与目标的量化定义

银行信用卡中心的目标:构建信用卡申请者的评分模型+减少客户违约造成的的损失。

信用评分的目标:预测客户是否违约。某银行对于违约的:客户在持卡期间欠款时间逾期90天,视作违约,被标识为“坏”客户。

(2)数据理解

明确商业目标后,下一步寻找数据,帮助实现商业目标。数据来源:银行内部信息+申请表信息+征信局外部信息

数据筛选:考虑样本的大小和质量。下一步数据质量检测和数据整合。

(3)数据准备

数据准备在整个数据评分的过程中非常重要,消耗时间也非常长,大约80%的时间花费在数据准备上。

目的:准备建模视图(宽表),包含预测建模中所有变量的数据宽表,且每个客户只有唯一的一条记录。

三方面的工作:一是收集到不同的数据集,大量清洗和转换,处理异常值和缺失值。二是粗选预测变量,对候选预测变量统计特征和违约率的分布进行分析。三是生成另外的候选预测变量,提高模型的预测能力,生成挖掘建模宽表。

(4)建立和开发模型

经典的评分技术:判别分析法、回归分析法、神经网络法、分类树方法。

真实的业务中,最常用的是Logistic回归模型,稳定+好理解。建模前变量分群。

(5)模型验证和评估

指标:预测结果准确+稳定+可解释

检验方法:从已知违约情况数据集中抽取。可以通过多个诊断统计量加以判定。

一个好的模型不应该包含太多的变量(最好不要超过15个变量)。最好有实际意义和可解释性。

(6)决策实施

第一步把分析结果即评分模型转化为可实施代码,如SAS、SQL等。第二步根据业务,最终确定接受、拒绝的临界得分值,反馈到银行的业务操作系统。

对高风险的打分的日常跟踪非常必要,对模型定期跟踪和验证。

0 0
原创粉丝点击