可调参的K-means算法

来源:互联网 发布:centos搭建网站 编辑:程序博客网 时间:2024/04/30 10:16

选自:《Unifying Dependent Clustering and Disparate Clustering for Non-homogeneous Data

传统的K-means的算法如下:

这个表示的是聚类的簇,i代表的的是不同的类,i'代表的是类外的点,i是类内的点。这个公式是代表的类内的点到类外的点的距离肯定小。

有公式可以看得出,整个公式是一个类似的阶跃函数,很明显这个不符合现实生活的,通常情况下,我们通过高斯核函数来优化聚类函数,使其更加平滑,符合我们的的精准度的要求,但是这是一个固定的不可调节的过程。因此,上面的文章中涉及了一种可调参数的聚类方法,具体如下:

Define:

这里的D代表的是类的中心到类外的最短距离,y则是代表待分类点到类外的距离与最大距离的乘机,所有的点均为矢量,我们的目标就是最小化所有的y,在这里引入了自动化里面常用的用于矢量优化的K-S函数,

最后得到我们的聚类函数:

这里面的P为人为设定参数,可以调节D为距离。


0 0
原创粉丝点击