Scala语言 + Spark MLLib进行机器学习---聚类
来源:互联网 发布:淘宝手机卡禁售 编辑:程序博客网 时间:2024/06/06 11:40
在下面的例子中,我们首先加载和解析数据,然后使用KMeans算法将数据聚成两类。聚类的数目可以在程序中设定并传递给KMeans算法。然后计算集合内方差和( Within Set Sum of Squared Error,这是评价聚类好坏的标准,数值越小说明同一簇实例之间的距离越小。---译者注)
import org.apache.spark.mllib.clustering.KMeans// Load and parse the dataval data = sc.textFile("kmeans_data.txt")val parsedData = data.map( _.split(' ').map(_.toDouble))// Cluster the data into two classes using KMeansval numIterations = 20val numClusters = 2val clusters = KMeans.train(parsedData, numClusters, numIterations)// Evaluate clustering by computing Within Set Sum of Squared Errorsval WSSSE = clusters.computeCost(parsedData)println("Within Set Sum of Squared Errors = " + WSSSE)
0 0
- Scala语言 + Spark MLLib进行机器学习---聚类
- Scala语言 + Spark MLLib进行机器学习---支持向量机
- Scala语言 + Spark MLLib进行机器学习---线性回归
- 机器学习讲座,如何利用Spark MLlib进行个性推荐?
- Spark 0.9.1 MLLib 机器学习库
- Spark 0.9.1 MLLib 机器学习库
- Spark MLlib之机器学习(一)
- Spark MLlib之机器学习(二)
- Spark MLlib之机器学习(三)
- Spark MLlib机器学习—封面
- 《Spark MLlib机器学习实践》内容简介、目录
- 《Spark MLlib 机器学习》第二章代码
- 《Spark MLlib 机器学习》第三章代码
- 《Spark MLlib 机器学习》第十四章代码
- 《Spark MLlib 机器学习》第十五章代码
- Spark-MLlib机器学习相关的数据类型
- Spark机器学习库(MLlib)指南
- MLlib On Spark(机器学习算法)
- IBM GDC 招聘贴
- 利用数组筛选素数
- 计算日期的时间差
- PHP之输出九九乘法表
- 几种Android布局layout组件主要常用属性
- Scala语言 + Spark MLLib进行机器学习---聚类
- 把存储过程结果集SELECT INTO到临时表
- 深度学习word2vec笔记之算法篇
- JS/jQuery杂记
- 免费VPN 上 YouTube
- OCP-1Z0-051 补充题库 第2题 添加外键FOREIGN KEY
- 无锡移动4G覆盖面积超700平方公里 新资费下月启动
- 基于Mobicents的conference demo实例的搭建
- 安装与开启SSH服务