机器学习之K-means聚类算法
来源:互联网 发布:mac蓝光播放软件 编辑:程序博客网 时间:2024/06/05 20:40
k均值算法的计算过程非常直观:
1、从D中随机取k个元素,作为k个簇的各自的中心。
2、分别计算剩下的元素到k个簇中心的相异度,将这些元素分别划归到相异度最低的簇。
3、根据聚类结果,重新计算k个簇各自的中心,计算方法是取簇中所有元素各自维度的算术平均数。
4、将D中全部元素按照新的中心重新聚类。
5、重复第3,4步,直到聚类结果不再变化。
6、将结果输出。
相似度计算:
方法1:欧式距离
方法2:曼哈顿距离
方法3:闵可夫斯基距离
这里有一个问题,就是不同维度的属性取值范围不同,对于最终结果的计算结果影响有偏差,所以需要进行规格化。所谓规格化就是将各个属性值按比例映射到相同的取值区间,这样是为了平衡各个属性对距离的影响。通常将各个属性均映射到[0,1]区间
映射公式:
其中max(ai)和min(ai)表示所有元素项中第i个属性的最大值和最小值
阅读全文
0 0
- 机器学习之聚类算法/Bisecting K-Means算法
- 机器学习之聚类算法(K-Means)
- 机器学习之聚类算法k-means
- 机器学习之K-means聚类算法
- 机器学习(25)之K-Means聚类算法详解
- 机器学习:k-Means聚类算法
- 机器学习-K-means聚类算法
- 机器学习之K-means算法:深入浅出K-Means算法
- 机器学习----聚类之k-means
- 机器学习算法 之 K-Means聚类
- 机器学习之K-means算法
- 【机器学习算法】之K-means聚类
- 机器学习之k-means算法
- 机器学习算法之K-means-spark
- 机器学习算法 - k-means Clustering K均值聚类
- 机器学习--k均值聚类(k-means)算法
- 机器学习算法与Python实践之(五)k均值聚类(k-means)
- 机器学习算法与Python实践之(五)k均值聚类(k-means)
- 最全Pycharm教程(33)——使用Pycharm编写IPython Notebook文件
- SSH框架入门(1)——struts2(1)
- Cookie笔记
- HDOJ1045
- [Mysql] 防御和检查SQL注入攻击的手段
- 机器学习之K-means聚类算法
- AngularJS ui.bootstrap.alert 消息
- Spring学习(三):初探Spring容器
- 我的递归总结
- SpringBoot学习之hello world
- HDU 6045 推公式
- 进 程 控 制
- 南阳理工学院acm 水池问题 自己的理解
- 面向对象