基于sparkMLlib的机器学习_[1]_基本数据类型[1]本地向量
来源:互联网 发布:淘宝海尔官方旗舰店 编辑:程序博客网 时间:2024/05/18 02:43
基于sparkMLlib的机器学习_[1]_基本数据类型[1]MLLIB中基本数据类型
参考:《spark MLlib机器学习实践》《SPARK MLLIB机器学习 算法、源码及实战详解》http://spark.apache.org/docs/latest/ml-guide.html
1-基本数据类型
Local vector 本地向量Labeled point 向量标签Local matrix 本地矩阵Distributed matrix 分布式矩阵2-数据格式
整数和浮点型1-1 本地向量
(1)稀疏型:spare
def sparse(size : scala.Int, indices : scala.Array[scala.Int], values : scala.Array[scala.Double])第一个参数:大于等于向量个数, 第二个参数:为values的index(可以跳过某些参数,但必须递增),第三个参数:元素值def sparse(size : scala.Int, elements : scala.Seq[scala.Tuple2[scala.Int, scala.Double]])def sparse(size : scala.Int, elements : java.lang.Iterable[scala.Tuple2[java.lang.Integer, java.lang.Double]])
(2)密集型:dense
/*1-基本数据类型:Local vector 本地向量Labeled point 向量标签Local matrix 本地矩阵Distributed matrix 分布式矩阵2-数据格式:整数和浮点型1-1 本地向量稀疏型:spares def sparse(size : scala.Int, indices : scala.Array[scala.Int], values : scala.Array[scala.Double]) 第一个参数:大于等于向量个数, 第二个参数:为values的index(可以跳过某些参数,但必须递增),第三个参数:元素值 def sparse(size : scala.Int, elements : scala.Seq[scala.Tuple2[scala.Int, scala.Double]]) def sparse(size : scala.Int, elements : java.lang.Iterable[scala.Tuple2[java.lang.Integer, java.lang.Double]])密集型:dense */object LocalVector { def main(args: Array[String]) { //====dense val vd:Vector = Vectors.dense(1,2,3,4) // spark.mllib.linalg.{Vectors,Vector}包下的密集型向量 println(vd(2)) // 3.0 //====sparse val vs:Vector = Vectors.sparse(5,Array(0,1,3,4),Array(1,2,3,4)) println(vs(4)) // 3.0 val vs2:Vector = Vectors.sparse(5,Array(0,1,4,3),Array(1,2,3,4)) println(vs2(4)) // 0.0 必须按递增 val vs3:Vector = Vectors.sparse(5,Array((1,1.0),(2,2.0))) println(vs3(1)) //1.0 }}
0 0
- 基于sparkMLlib的机器学习_[1]_基本数据类型[1]本地向量
- 基于sparkMLlib的机器学习_[1]_基本数据类型[2]向量标签LabeledPoint
- 基于sparkMLlib的机器学习_[1]_基本数据类型[3]本地矩阵Local Matrix
- 基于sparkMLlib的机器学习_[1]_基本数据类型[4]分布式矩阵DistrubutedMatrix
- 基于sparkMLlib的机器学习_[2]_基本算法[1]协同过滤算法
- 机器学习_支持向量机
- day02_变量_基本数据类型_数据类型的转换_Scanner_20150731
- Java学习_ 基本数据类型_float
- pg学习_基本表定义_数据类型
- 黑马程序员_高新技术:1)eclipse的使用技巧_可变参数_增强for循环_基本数据类型的自动拆箱与装箱
- 机器学习总结6_支持向量机(SVM)
- 机器学习(周志华)_第六章 支持向量机
- 机器学习(1)_一些知识点的初步理解
- 1_数据类型转换
- 机器学习总结1_学习理论
- 机器学习算法_第1篇
- SVM支持向量机学习笔记 _ 1 数学基础
- 2.1_数据类型1_赋值
- 编译原理实验二分析
- apache spring @RequiresRoles 不起作用
- jquery swipper插件的一些弊端
- 欢迎使用CSDN-markdown编辑器
- 程序员获取编程灵感的 10 种方式
- 基于sparkMLlib的机器学习_[1]_基本数据类型[1]本地向量
- Eclipse Luna(4.4) 安装tomcatPlugin
- 修改UITextfield的Placeholder字体的颜色
- Mac终端配色方案【转】
- js中的函数劫持
- Dockerfile使用详解
- dataTablas Ajax分页 ThinkPHP
- oracle中char与varchar2的区别
- Runtime(动态添加方法)笔记