机器学习-随机森林(randomForest)模型的优化策略
来源:互联网 发布:淘宝暴力引流软件 编辑:程序博客网 时间:2024/05/22 06:11
随机森林模型的优化主要有两个方面的策略:
1.特征选择
1)输入特征按照其重要性从高到底排序,其中特征重要性排序可以根据与输出变量的皮尔森相关系数或者由支持向量机模型得出;
2)去除与输出变量相关性很小的特征;
3)在原有特征的基础上,添加新的特征,新特征可以是原有特征集的组合或划分,例如将year按season划分,将weekend和holiday组合为restday
2.参数优化
以python的sklearn.ensemble.RandomForestRegressor库为例,主要需要调节的参数为:
1)n_estimators:表示树的数量,通常随着树的数量的增加,预测误差会逐渐减小,当到达一定数目时,误差的变化变得很小,这时候就可以确定较为合理的树的数量;n_estimators的选择可通过图形大致判断模型内误差稳定时的值。
2)max_features:表示基决策树的每个节点随机选择的最大特征数,传统决策树模型在选择特征时考虑所有可能的特征,而它降低了单个树的多样性,而由于随机森林基于集成学习思想的优点,减小max_features不仅会提升算法速度,也有可能降低测试误差,这也是RF模型在Bagging集成学习方法基础上的一个改进;对max_features的选择是逐一尝试,直到找到比较理想的值
阅读全文
0 0
- 机器学习-随机森林(randomForest)模型的优化策略
- 随机森林算法学习(RandomForest)
- 【机器学习实战】第7章 集成方法 随机森林(RandomForest)和 Adaboost
- 【R的机器学习】模型性能提升探索:随机森林
- 基于C++的RandomForest随机森林总结
- RandomForest随机森林总结
- RandomForest随机森林感想
- RandomForest随机森林总结
- 随机森林-RandomForest
- 随机森林 RandomForest java
- Sklearn-RandomForest随机森林
- 机器学习——随机森林算法randomForest——原理及python实现
- 随机森林-机器学习
- 机器学习 -- 随机森林
- 机器学习-随机森林
- 机器学习-随机森林
- 随机森林算法(RandomForest,RF)
- 机器学习算法(六):随机森林
- windows下的使用别人编译好的库文件进行安装xgboost
- java基础知识总结
- TensorFlow下构建高性能神经网络模型的最佳实践
- Zookeeper启动异常:Error contacting service. It is probably not running.
- ssh免密登录
- 机器学习-随机森林(randomForest)模型的优化策略
- css3新增选择器
- codeforces 1C 计算几何
- unity3d配置Android环境,打包发布Apk流程详解
- 浅谈linux用户与用户组的概念
- List Contains方法使用问题
- 查看本机的系统字符集
- bzoj1196 [HNOI2006]公路修建问题(二分答案+kruskal/贪心)
- 数值的整数次方