Spark ML包随机森林回归
来源:互联网 发布:操盘手训练软件 编辑:程序博客网 时间:2024/05/17 07:27
官方文档:
trainRegressor(input: RDD[LabeledPoint], categoricalFeaturesInfo: Map[Int, Int], numTrees: Int,
featureSubsetStrategy: String, impurity: String, maxDepth: Int,
maxBins: Int, seed: Int = Utils.random.nextInt())
我们需要一个LabeledPoint 格式的 训练数据
LabeledPoint 由两部分组成
val input=LabeledPoint(Label,Feature(Vector型))
Label需要为double型
此处我们需要Import LabledPoint 和Vector2个包:
import org.apache.spark.mllib.regression.LabeledPoint
import org.apache.spark.mllib.linalg.{Vectors,Vector}
其他参数:
categoricalFeaturesInfo:一个Map,表示离散特征,格式为[colId,该colId对应特征的维度数]
numTrees:树的数量
featureSubsetStrategy:特征采样方法,选用"auto"代表按1/3采样
impurity:计算特征重要性的指标,此处为回归,选用"variance"
maxDepth:树的最大深度
maxBins:树的最大分裂区间数
seed:随机种子,可不填
val model=RandomForest.trainRegressor(...)
val pre=model.predict("test_feature")
pre为最终回归结果
- Spark ML包随机森林回归
- Spark ML随机森林
- spark ml 随机森林源码笔记一
- spark ml 随机森林源码笔记二
- spark ml 随机森林源码笔记三
- spark ml 随机森林源码笔记四
- spark ml 随机森林源码笔记五
- SPARK官方实例:两种方法实现随机森林模型(ML/MLlib)
- SPARK模型实例:两种方法实现随机森林模型(MLlib和ML)
- 分类&回归算法-随机森林
- Spark中组件Mllib的学习38之随机森林(使用variance)进行回归
- Spark-ML 线性回归 LinearRegression (1)
- 随机森林调用matlab代码做回归
- 分类和回归树,随机森林,霍夫森林
- 随机森林回归(Random Forest)算法原理及Spark MLlib调用实例(Scala/Java/python)
- 小试随机森林(random forest)算法ml
- 小试随机森林(random forest)算法ml
- Scala-Spark实现RF(随机森林)
- Groory(一) 语法篇---极速入门总结
- spring+mybatis使用MapperScannerConfigurer引起的PropertyPlaceholderConfigurer无效问题
- 【GDB调试学习笔记】 Makefie上
- Hilari 中文API说明
- HDU 1811 Rank of Tetris(拓扑排序,队列实现,并查集)
- Spark ML包随机森林回归
- Opencv图像识别从零到精通(22)-----hough变换检测直线与圆
- Java Web开发-简单的Java Web项目(含访问本地MySQL)-应用例程
- hdu2204 Eddy's 爱好 【容斥原理】
- distinct 和 group by 在查询多列数据去重复时的区别在哪?
- CDH key value index lily安装配置
- Copy List with Random Pointer
- poj3252 数位dp
- 8种常见机器学习算法比较