kmean、KNN、kd树的改进算法BBF

来源:互联网 发布:淘宝千牛包邮怎么设置 编辑:程序博客网 时间:2024/06/16 20:22


1. k-Means

k-Means这里k的概念是指聚类的k个中心,聚类成K类,k均值算法的计算过程非常直观:

      1、从D中随机取k个元素,作为k个簇的各自的中心。

      2、分别计算剩下的元素到k个簇中心的相异度,将这些元素分别划归到相异度最低的簇。

      3、根据聚类结果,重新计算k个簇各自的中心,计算方法是取簇中所有元素各自维度的算术平均数。

      4、将D中全部元素按照新的中心重新聚类。

      5、重复第4步,直到聚类结果不再变化。

      6、将结果输出。

k-means参考:http://www.cnblogs.com/leoo2sk/archive/2010/09/20/k-means.html

K-Means ++ 算法

k-means++算法选择初始seeds的基本思想就是:初始的聚类中心之间的相互距离要尽可能的远。

1. 从输入的数据点集合中随机选择一个点作为第一个聚类中心
2. 对于数据集中的每一个点x,计算它与最近聚类中心(指已选择的聚类中心)的距离D(x)
3. 选择一个新的数据点作为新的聚类中心,选择的原则是:D(x)较大的点,被选取作为聚类中心的概率较大
4. 重复2和3直到k个聚类中心被选出来
5. 利用这k个初始的聚类中心来运行标准的k-means算法


2. knn

xxx待完成

原创粉丝点击