K-Means
来源:互联网 发布:sve14aa12t热键软件 编辑:程序博客网 时间:2024/05/20 21:23
在数据挖掘中, k-Means 算法是一种 cluster analysis 的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。
问题
K-Means算法主要解决的问题如下图所示。我们可以看到,在图的左边有一些点,我们用肉眼可以看出来有四个点群,但是我们怎么通过计算机程序找出这几个点群来呢?于是就出现了我们的K-Means算法(Wikipedia链接)
这个算法其实很简单,如下图所示:
K-Means 算法概要
从上图中,我们可以看到,A, B, C, D, E 是五个在图中点。而灰色的点是我们的种子点,也就是我们用来找点群的点。有两个种子点,所以K=2。
然后,K-Means的算法如下:
1.随机在图中取K(这里K=2)个种子点。
2.然后对图中的所有点求到这K个种子点的距离,假如点Pi离种子点Si最近,那么Pi属于Si点群。(上图中,我们可以看到A,B属于上面的种子点,C,D,E属于下面中部的种子点)
3.接下来,我们要移动种子点到属于他的“点群”的中心。(见图上的第三步)
4.然后重复第2)和第3)步,直到,种子点没有移动(我们可以看到图中的第四步上面的种子点聚合了A,B,C,下面的种子点聚合了D,E)。
求距离的公式
求点群中心的算法
原文地址:http://blog.jobbole.com/23157/
- K-Means
- k-means
- K-means
- k means
- K-means
- K-means
- K-Means
- k-means
- k-means
- k-means
- k-means
- k-means
- k-means
- K-means ++
- k-means
- k-Means
- K-means
- K-Means
- git命令网状图
- 在windows下如何用cscope实现函数定位
- VirtualBox虚拟机网络设置(四种方式)
- 安装nokogiri错误解决
- 开发者想走向海外:你融入老外的圈子了吗?
- K-Means
- ios开发数据存储小结
- 【为什么要升级?10个理由让你升级到win 2003】
- Android判断程序是否第一次运行
- C 实现黑客帝国数字雨
- CMS未来发展方向分析
- 为wordpress提速,禁用gravatar,使用本地头像
- c socket(转载)
- 关于SSI的一点使用心得