caret包应用之三:建模与参数优化
来源:互联网 发布:手机软件网络错误 编辑:程序博客网 时间:2024/06/06 15:00
原文地址:http://xccds.github.io/2011/09/caret_1976.html/
在进行建模时,需对模型的参数进行优化,在caret包中其主要函数命令是train。
首先得到经过特征选择后的样本数据,并划分为训练样本和检验样本
newdata4=newdata3[,Profile$optVariables]然后定义模型训练参数,method确定多次交叉检验的抽样方法,number确定了划分的重数, repeats确定了反复次数。
inTrain = createDataPartition(mdrrClass, p = 3/4, list = FALSE)
trainx = newdata4[inTrain,]
testx = newdata4[-inTrain,]
trainy = mdrrClass[inTrain]
testy = mdrrClass[-inTrain]
fitControl = trainControl(method = "repeatedcv", number = 10, repeats = 3,returnResamp = "all")确定参数选择范围,本例建模准备使用gbm算法,相应的参数有如下三项
gbmGrid = expand.grid(.interaction.depth = c(1, 3),.n.trees = c(50, 100, 150, 200, 250, 300),.shrinkage = 0.1)利用train函数进行训练,使用的建模方法为提升决策树方法,
gbmFit1 = train(trainx,trainy,method = "gbm",trControl = fitControl,tuneGrid = gbmGrid,verbose = FALSE)从结果可以观察到interaction.depth取1,n.trees取150时精度最高
interaction.depth n.trees Accuracy Kappa Accuracy SD Kappa SD
1 50 0.822 0.635 0.0577 0.118
1 100 0.824 0.639 0.0574 0.118
1 150 0.826 0.643 0.0635 0.131
1 200 0.824 0.64 0.0605 0.123
1 250 0.816 0.623 0.0608 0.124
1 300 0.824 0.64 0.0584 0.119
3 50 0.816 0.621 0.0569 0.117
3 100 0.82 0.631 0.0578 0.117
3 150 0.815 0.621 0.0582 0.117
3 200 0.82 0.63 0.0618 0.125
3 250 0.813 0.617 0.0632 0.127
3 300 0.812 0.615 0.0622 0.126
同样的图形观察
plot(gbmFit1)
0 0
- caret包应用之三:建模与参数优化
- caret包应用之四:模型预测与检验
- R语言之-caret包应用
- caret包应用之二:特征选择
- caret包应用之二:特征选择
- caret包应用之一:数据预处理
- caret包应用之一:数据预处理
- caret包处理流程
- caret包处理流程
- 3DMAX在三维GIS建模中的应用与优化
- caret包函数不完全解析
- R语言利用caret包对变量重要程度排序与选择特性
- UML(统一建模语言)之要点与应用
- R语言 caret包 findCorrelation()函数用法
- redhat/centos安装caret包失败
- MySQL优化之三--Mysql服务参数配置
- mysql优化之三(数据库参数配置)
- Oracle优化之应用设计与实现
- CPU中的寄存器
- springMVC的配置文件
- C结构体边界对齐1
- Xcode: 给项目添加framework
- 程序员转型产品经理经验分享
- caret包应用之三:建模与参数优化
- 圆形头像裁剪,可以缩放预览,裁剪为圆形
- vim常用命令
- 用easybcd恢复引导界面出现ubuntu
- caret包应用之四:模型预测与检验
- 健康至关重要
- Java线程池使用说明
- C结构体边界对齐2
- iOS 开发 后台机制