机器学习-K-means聚类算法

来源:互联网 发布:mac散热 编辑:程序博客网 时间:2024/05/22 07:48

K-means算法是聚类算法中的一种,其中K为类别数,means表示均值,基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心(这个点可以不是样本点),从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。

算法步骤

(1)为待分类的点寻找聚类中心;
(2)计算每个点到聚类中心的距离,将每个点聚类到离它最近的聚类中心处;
(3)计算每个聚类中所有点的坐标平均值,将该平均值作为新的聚类中心;
(4)反复执行步骤(2)、(3),直到聚类中心不发生大幅度改变或者达到迭代次数为止。
求点群中心点的算法可以像上述那样用各个点的X/Y坐标的平均值。不过还有其它算法求中心点的的公式:

求点群中心的算法

1)Minkowski Distance公式——λ可以随意取值,可以是负数,也可以是正数,或是无穷大。
这里写图片描述
2)2)Euclidean Distance公式——也就是第一个公式λ=2的情况
这里写图片描述
3)CityBlock Distance公式——也就是第一个公式λ=1的情况
这里写图片描述

原创粉丝点击