简要说说k-means 聚类的过程

来源:互联网 发布:js判断小数点后的位数 编辑:程序博客网 时间:2024/06/05 00:45

k-means聚类属于无监督学习的一种,在没有给与labels的情况下,将数据分成指定的K类。pou一张经典的图来看看这个算法。
这里写图片描述
对于第一张图一样的散乱的数据样本的聚类,首先,假设要聚成两大团,那么,随机给两个点的坐标,如同第二张图的两个十字mark,然后第一步就是帮所有点认领归属的团,站第一次队。认领方法是,每个点都算一算自己到这两个十字mark的距离,认领距离小的那个mark,作为自己的归属。好了,第一次站队完后,形成了第三张图的局势。很明显,现在的十字mark位置已经不合适了,需要重新设置各自阵营自己的mark。游戏规则是,红队阵营所有的点的坐标都来加和求出横坐标和纵坐标的平均值,这个平均后的坐标位置就是新的mark。当然,蓝队阵营也一样的进行,选出新的mark。
这次mark和上一次不一样吧?那说明这次细分有效果了
接下来,进行第二次站队,也就是所有的点再一次计算和两个mark的距离,认领新的mark归属,好了,新的局势再次形成,接下来继续选择合适的mark新位置,和上次对比发现,依然后变化,恩!那就对了,不断重复这两个步骤,直到mark位置几乎不变,那就完成了聚类过程。

0 0
原创粉丝点击