Spark 机器学习 —— KMeans

来源:互联网 发布:网络大电影发行 编辑:程序博客网 时间:2024/06/06 05:38

创建模型所对应的类及模型训练

import org.apache.spark.mllib.clustering.KMeansval kmeans = new KMeans()val model = kmeans.run(data)            # 要求 data 的类型为 RDD[Vector]

显示模型训练的结果

model.clusterCenters.foreach(println)                # 聚类中心(仍然为特征向量)

预测(model.predict)

model.predict(feat)
0 0
原创粉丝点击