spark - k-mean
来源:互联网 发布:北京网络医生招聘 编辑:程序博客网 时间:2024/06/08 15:26
/** * 1.0 1.0 * 1.0 2.0 * 2.0 1.0 * 2.0 2.0 * 3.0 3.0 * 3.0 4.0 * 4.0 3.0 * 4.0 4.0 */package com.spark.testimport org.apache.spark.{ SparkContext, SparkConf }import org.apache.spark.SparkContext._import org.apache.spark.mllib.clustering.KMeansimport org.apache.spark.mllib.linalg.Vectorsobject ObKMeans { def main(args: Array[String]) { run() } def run() { val conf = new SparkConf().setAppName("ObKMeansTest") val sc = new SparkContext(conf) // Load and parse the data val data = sc.textFile("/ruson/kmean.txt") // org.apache.spark.mllib.linalg.Vector // val parsedData = data.map( _.split(' ').map(_.toVector)) val parsedData = data.map(s => Vectors.dense(s.split(' ').map(_.toDouble))) // Cluster the data into two classes using KMeans val numIterations = 20 val numClusters = 4 val clusters = KMeans.train(parsedData, numClusters, numIterations) // Evaluate clustering by computing Within Set Sum of Squared Errors val WSSSE = clusters.computeCost(parsedData) println("Within Set Sum of Squared Errors = " + WSSSE) val result = parsedData.map(point => clusters.predict(point)) val resultFile = "/ruson/KMeansResult" result.saveAsTextFile(resultFile) println("Result file : " + resultFile) }}
上面是数据集;运行之后结果分为四类如下
0 0
- spark - k-mean
- k-mean算法实现
- K-mean clustering 算法
- opencv笔记:K-mean
- K-mean and fuzzy C-mean clustering
- k-mean和k-mean++和轮廓系数
- K-means & Mean shift algorithm
- K-Mean聚类算法
- 数据挖掘之K-Mean
- K-mean聚类算法
- k-mean控卫聚类分析
- K-均值聚类算法(K-mean)
- 聚类算法之K-mean算法
- 聚类问题-k-mean算法
- K-mean算法的优点缺点
- k-mean算法的java实现
- k-mean聚类算法实现
- 聚类方法之k-mean算法
- Android 开发------------------ 修改 Actionbar 的样式
- JAVA5新特性
- viewpage 实现左右循环滑动
- UIBezierPath+CAShapeLayer 绘制自定义图形
- 你的 App 无人问津的原因?
- spark - k-mean
- 内存管理
- Linux ALSA声卡驱动之四:Control设备的创建
- Chrome始终位于最前端的解决办法
- App工程结构搭建:几种常见Android代码架构分析
- Java线程Dump分析工具--jstack
- mysql的general log和slow log的配置步骤
- Linux ALSA声卡驱动之五:移动设备中的ALSA(ASoC)
- ios申请真机调试( xcode 5)详细解析