简要说说k-means 聚类的过程

来源：互联网发布：js判断小数点后的位数编辑：程序博客网时间：2024/06/05 00:45

k-means聚类属于无监督学习的一种，在没有给与labels的情况下，将数据分成指定的K类。pou一张经典的图来看看这个算法。
这里写图片描述
对于第一张图一样的散乱的数据样本的聚类，首先，假设要聚成两大团，那么，随机给两个点的坐标，如同第二张图的两个十字mark,然后第一步就是帮所有点认领归属的团，站第一次队。认领方法是，每个点都算一算自己到这两个十字mark的距离，认领距离小的那个mark,作为自己的归属。好了，第一次站队完后，形成了第三张图的局势。很明显，现在的十字mark位置已经不合适了，需要重新设置各自阵营自己的mark。游戏规则是，红队阵营所有的点的坐标都来加和求出横坐标和纵坐标的平均值，这个平均后的坐标位置就是新的mark。当然，蓝队阵营也一样的进行，选出新的mark。
这次mark和上一次不一样吧？那说明这次细分有效果了
接下来，进行第二次站队，也就是所有的点再一次计算和两个mark的距离，认领新的mark归属，好了，新的局势再次形成，接下来继续选择合适的mark新位置，和上次对比发现，依然后变化，恩！那就对了，不断重复这两个步骤，直到mark位置几乎不变，那就完成了聚类过程。

0 0