谱聚类
来源:互联网 发布:淘宝网上台湾是台湾省 编辑:程序博客网 时间:2024/04/29 13:37
谱聚类
标签(空格分隔): 机器学习 聚类
机器学习第二弹,谱聚类的实现。聚类是一种非常重要的工作,解决这个问题传统的方法有EM等生成式算法或者K-means之类的传统聚类方法,生成式算法首先需要做一些比较强的假设,比如每一个簇满足高斯分布,而且容易陷入局部最小值,从而需要多次进行运算,从而得到最优解。
要进行谱聚类,首先要构造数据的相似度矩阵。谱聚类把一个传统的聚类的游动过程灵活地转变成了一个图划分问题。首先讲一下谱聚类的算法流程:
1)计算数据集的相似矩阵
2)计算度矩阵
3)计算拉普拉斯矩阵
4)按照Rayleigh-Ritz原理,计算拉普拉斯矩阵的最小的
5)在第四步得到的矩阵上运行K-means算法,把每一行对应的点分配到对应的簇中。第四部的每一行即对应原始数据中的一个数据点。
下面讲解这个算法的运行原理,怎样把一个图划分问题转化为一个拉普拉斯矩阵的特征向量聚类过程。首先要构造一个有权无向图,怎么来定义权呢。传统的欧几里得距离如果两者的距离越远,那么相似度其实应该更低。这儿我们可以使用高斯相似度来转换,即传统的RBF kernel.距离越远,相似度越低,反之,距离越近,相似度越高。现在我们想要把这个连通图划分为几个连图子图,选择切哪些边呢?当然是权重比较小的边。定义点
即把图划分为几个连通子图的最优方案,即为求解以上第三个式子的最小值。又因为
定义向量
可以得到以下等式:
其中
所以要最小化RatioCut等价于最小化
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- 谱聚类
- HDU 1724 Ellipse 【自适应Simpson积分】
- org.springframework.beans.factory.BeanDefinitionStoreException: IOException
- 初谈学习前的复习与回顾
- JAVA求学之路第十天
- SSM框架——详细整合教程(Spring+SpringMVC+MyBatis)
- 谱聚类
- JAVA继承和重写
- 事件监听器
- uva10487/lower_bound使用
- JAVA求学之路第十一天(继承&抽象&final)
- 【书山有路】SQL必知必会 第12课
- HDOJ 2846 Repository
- poj2084Game of Connections 卡特兰数
- LongAdder与AtomicInteger并发性能的简单比较测试