spark之MLlib机器学习-Kmeans
来源:互联网 发布:java租车系统界面 编辑:程序博客网 时间:2024/05/16 23:53
1、构建SBT项目环境
mkdir -p ~/kmeans/src/main/scala
2、编写kmeans.sbt
name := "Kmeans Project"version := "1.0"scalaVersion := "2.11.8"libraryDependencies ++=Seq( "org.apache.spark" %% "spark-core" % "2.0.0", "org.apache.spark" %% "spark-mllib" % "2.0.0")
当时,忘记添加mllib库,出现报错:“error object mllib is not a member of package org.apache.spark
”
3、编写scala源代码 kmeans_test.scala
import org.apache.spark.mllib.clustering.KMeansimport org.apache.spark.mllib.linalg.Vectorsimport org.apache.spark.SparkConfimport org.apache.spark.SparkContextimport org.apache.spark.SparkContext._object kmeans_test{ def main(args: Array[String]) { val conf = new SparkConf().setAppName("Kmeans Test") val sc = new SparkContext(conf) val data=sc.textFile("file:///usr/spark2.0/data/mllib/kmeans_data.txt") val parsedData=data.map(s=>Vectors.dense(s.split(" ").map(_.toDouble))).cache() val numClusters=2 val numIterations=20 val clusters=KMeans.train(parsedData,numClusters,numIterations) val WSSSE=clusters.computeCost(parsedData) println("Within Set Sum of Squared Errors="+WSSSE) sc.stop() }}
4、将scala源码拷贝至~/kmeans/src/main/scala/目录下
6、最终工程目录如下:
find ../kmeans.sbt/src/src/main/src/main/scala/src/main/scala/kmean_test.scala
5、进入kmeans目录,执行编译操作
cd ~/kmeans sbt complile
4、编译完成后执行打包
sbt package
5、打包完成后使用spark-submit工具提交任务
spark-submit --class kmeans_test target/scala-2.11/kmeans-project_2.11-1.0.jar
6、结果输出如下:
0 0
- spark mllib机器学习之四 kmeans
- spark之MLlib机器学习-Kmeans
- Spark MLlib之KMeans
- spark笔记-MLlib之kmeans
- Spark MLlib之机器学习(一)
- Spark MLlib之机器学习(二)
- Spark MLlib之机器学习(三)
- spark mllib机器学习之二 DecisionTree
- spark mllib机器学习之三 FPGrowth
- spark mllib机器学习之五 LinearRegressionWithSGD
- spark mllib机器学习之六 ALS
- spark mllib机器学习之七 TFIDF
- spark之MLlib机器学习-线性回归
- Spark MLlib机器学习之朴素贝叶斯小试牛刀
- Spark MLlib源代码解读之KMeans(下)
- Spark学习之基于MLlib的机器学习
- Spark中组件Mllib的学习1之Kmeans错误解决
- Spark机器学习库mllib之协同过滤
- backApp项目部署处理总结
- git各大平台客户端集合
- 设计模式三:模板方法模式
- 数据采集之Web端导入日志文件到Hadoop HDFS
- [BZOJ4538]网络
- spark之MLlib机器学习-Kmeans
- 使用CSS3开启GPU硬件加速提升网站动画渲染性能
- Java总结篇系列:Java泛型
- POJ
- 排序算法总结
- SSH免密码登录
- MFC-两个基本控件:TreeControl以及RichControl
- Maven中添加Oracle jdbc jar包
- fnxdvjnbxdhtlxh