机器学习_谱聚类

来源:互联网 发布:linux可以用网银吗 编辑:程序博客网 时间:2024/06/13 23:35

【1】http://f.dataguru.cn/thread-460065-1-1.html

【2】聚类确实是将相似的样本归为一类,使同类样本相似度尽可能高,异类的相似性尽可能低。..

【3】谱聚类:是采用图的思想。样本点作为图中的点,边为样本点之间的相似度。

         所以谱聚类就是想去边,去掉边的权重尽量小,即异类样本间尽量不同;子图内边的权重尽量大,同类样本尽可能相似。

【n】知识点:

核函数的理解:就是高维空间中的两个参数的内积。

高斯核中的带宽是人为设定的参数。可用高斯核函数来衡量相似性

拉普拉斯矩阵详情见上链接,注意性质。