评分卡模型开发-定性指标筛选
来源:互联网 发布:淘宝详情页自动生成 编辑:程序博客网 时间:2024/04/29 21:20
定量指标是数值型的,我们还可以用回归的方法来筛选,那么定性的指标怎么办呢?
R里面给我们提供了非常强大的IV值计算算法,通过引用R里面的informationvalue包,来计算各指标的IV值,即可得到各定性指标间的重要性度量,选取其中的high predictive指标即可。
有很多小伙伴不知道informationvalue是什么:
我大概说一下,IV值衡量两个名义变量(其中一个是二元变量)之间关联性的常用指标。
library(InformationValue)library(klaR)credit_risk<-ifelse(train_kfolddata[,"credit_risk"]=="good",0,1)#将违约状态变量用0和1表示,1表示违约。tmp<-train_kfolddata[,-21]data<-cbind(tmp,credit_risk)data<-as.data.frame(data)factor_vars<-c("status","credit_history","purpose","savings","employment_duration", "personal_status_sex","other_debtors","property", "other_installment_plans","housing","job","telephone","foreign_worker")#获取所有名义变量all_iv<-data.frame(VARS=factor_vars,IV=numeric(length(factor_vars)), STRENGTH=character(length(factor_vars)),stringsAsFactors = F)#初始化待输出的数据框for(factor_var in factor_vars){ all_iv[all_iv$VARS==factor_var,"IV"]<-InformationValue::IV(X= data[,factor_var],Y=data$credit_risk) #计算每个指标的IV值 all_iv[all_iv$VARS==factor_var,"STRENGTH"]<-attr(InformationValue::IV(X= data[,factor_var],Y=data$credit_risk),"howgood") #提取每个IV指标的描述}all_iv<-all_iv[order(-all_iv$IV),] #排序IV
由结果可知,可选择的定性入模指标,如表3.12所示。
综上所述,模型开发中定量和定性的入模指标如表3.13所示。
对入模的定量和定性指标,分别进行连续变量分段(对定量指标进行分段),以便于计算定量指标的WOE和对离散变量进行必要的降维。对连续变量的分段方法通常分为等距分段和最优分段两种方法。等距分段是指将连续变量分为等距离的若干区间,然后在分别计算每个区间的WOE值。最优分段是指根据变量的分布属性,并结合该变量对违约状态变量预测能力的变化,按照一定的规则将属性接近的数值聚在一起,形成距离不相等的若干区间,最终得到对违约状态变量预测能力最强的最优分段。
定量指标筛选见上篇:
http://blog.csdn.net/lll1528238733/article/details/76600019
阅读全文
0 0
- 评分卡模型开发-定性指标筛选
- 评分卡模型开发-定量指标筛选
- 评分卡模型开发-数据集准备
- 评分卡模型开发-主标尺设计及模型验证
- Scorecard 评分卡模型
- 信用评分卡模型
- 评分卡模型开发-基于逻辑回归的标准评分卡实现
- 评分卡模型开发-用户数据缺失值处理
- 评分卡模型开发-用户数据异常值处理
- 信用标准评分卡模型开发及实现
- 评分法模型开发-WOE值计算
- 模型指标
- 某研究所招聘评分指标?
- 用R做评分卡模型
- 初探机器学习与评分卡模型
- 评分卡的开发过程
- 4步教你开发风控评分模型
- 4步教你开发风控评分模型
- 手动建立数据集
- Angular入门之依赖注入
- JAVA学习记录---入门---for,each循环
- 【CodeForces
- TClientDataSet[2]: Data、XMLData
- 评分卡模型开发-定性指标筛选
- HashSet<T> 源码解析
- 1.B向量空间的定义
- [随心译]2017.8.2-基于触摸的AR将是增强现实的下个发展阶段吗?
- 浅谈 Python 的 with 语句
- 关操作复选框(全选或全不选)
- AngularJS 应用身份认证的技巧
- TClientDataSet[1]: 浏览测试数据
- IntelliJ IDEA使用(一):创建maven web项目