笔记+R︱风控模型中变量粗筛(随机森林party包)+细筛(woe包)
来源:互联网 发布:java和jsp的区别 编辑:程序博客网 时间:2024/05/16 00:44
每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~
———————————————————————————
本内容来源于CDA-DSC课程内容,原内容为《第16讲 汽车金融信用违约预测模型案例》。
建立违约预测模型的过程中,变量的筛选尤为重要。需要经历多次的筛选,在课程案例中通过了随机森林进行变量的粗筛,通过WOE转化+决策树模型进行变量细筛。
一、变量粗筛——随机森林模型
与randomForest包不同之处在于,party可以处理缺失值,而这个包可以。
mtry代表在每一棵树的每个节点处随机抽取mtry 个特征,通过计算每个特征蕴含的信息量,特征中选择一个最具有分类能力的特征进行节点分裂。
varimp代表重要性函数。( R语言︱决策树族——随机森林算法)
二、R语言实现WOE转化+变量细筛
R语言中有一个woe包,可以实现WOE转化的同时,通过WOE值进行y~x的决策树建立,应用决策树的重要性来进行变量细筛。
woe包需要从github中下载得到:
#library(devtools)#install_github("riv","tomasgreif")
library(woe) IV<-iv.mult(step2_2,"y",TRUE) #原理是以Y作为被解释变量,其他作为解释变量,建立决策树模型iv.plot.summary(IV)
summary(step2_3)
0 0
- 笔记+R︱风控模型中变量粗筛(随机森林party包)+细筛(woe包)
- 随机森林(R)
- R语言︱机器学习模型评估方案(以随机森林算法为例)
- R语言-决策树-party包
- R︱mlr包挑选最适机器学习模型+变量评估与选择(案例详解)
- 随机森林(Random Forest)模型
- python包sk-learn中的随机森林
- Spark ML包随机森林回归
- 金融风控-->申请评分卡模型-->特征工程(特征分箱,WOE编码)
- 机器学习之随机森林(R)randomFordom算法案例
- R语言_rpart包和party包的简单比较
- 笔记︱信用风险模型(申请评分、行为评分)与数据准备(违约期限、WOE转化)
- 【R的机器学习】模型性能提升探索:随机森林
- R语言随机森林
- 随机森林(python)
- 决策树模型组合之(在线)随机森林与GBDT
- 决策树模型组合之(在线)随机森林与GBDT
- 决策树模型组合之(在线)随机森林与GBDT
- 【leetcode】225. Implement Stack using Queues
- java中常见异常
- c++ 友元类 练习题
- execute、executeQuery和executeUpdate之间的区别
- Android中相机拍照并获取路径
- 笔记+R︱风控模型中变量粗筛(随机森林party包)+细筛(woe包)
- "双向链表"-数据结构算法-之通俗易懂,完全解析
- Codeforces Round #358 (Div. 2) C. Alyona and the Tree (DFS)
- Chromium内核net模块disk cache/index file的文件存储机制
- iOS内存管理(3)-- iOS 代理要用weak修饰
- Mac adb 配置
- 打印各种形状三角形(Triangle Printing Program)
- Android获取一些常用信息
- ISO8859-1、UTF-8 与GB2312