Density Peak
来源:互联网 发布:淘宝封号花呗怎么处理 编辑:程序博客网 时间:2024/04/30 07:09
参考文献:2014年发表在Nature上的文章Clustering by fast search and find of density peaks
核心思想:密度比邻居节点高、与比其密度大的点的距离相对大的点是聚类中心。
1. 两个定义:
1.1.局部密度
其中,
也可以采用gassion kernal计算:
1.2.密度比i大且距i最近的点与i的距离
特别的,对于密度最大的点,
2.聚类中心的选择
3.其他点的分配
其余非聚类中心点,被分配到密度比其大、距离最近的点所属的类(高密度向低密度传播,因此适用于流型)
4.分配的可靠性度量
没有引入noise-signal cutoff.本文为每个聚类定义了border
region(分配到该类但距其他类中点的距离小于dc的点的集合) 对每个聚类,找到其borderregion中点的最大密度
ρb 在某个聚类c中,
ρi >ρb ,则i会分配到聚类c中,否则i被称为halo(可以被理解为噪声)
5.dc的取值
可以去dc,使得平均邻居数占数据集中所有点的1%-2%
dc的取值具有鲁棒性,dc大,
6.cutoff kernal or gaussion kernal
对与小数据集,
7.实验效果
输入:距离矩阵/相似度矩阵(不一定要是欧式距离),只需要点之间的关系(通过MDS多维尺度变换能直观的展现数据点之间在多种距离上离得多近,还可以产生一个低维的数据点表示,MDS不需要原始数据,只需要衡量点间距离的距离矩阵。)
7.1.Spiral
7.2.Flame
7.3.Aggregation
7.4.Jain
8.思考
Q1.当密度分布不均匀时,聚类效果如何?
效果不好(如Jain数据集),在计算局部密度时并没有考虑局部结构
Q2.重叠群组?
不交叉
- Density Peak
- Density Peak改进(overlapping)
- Density Peak改进(Hierarchical)
- Density Peak改进(PCA/KNN)
- 文献阅读笔记——Clustering by fast search and find of density peak
- 【论文学习笔记】Clustering by fast search and find of density peak
- Density Estimate
- android density
- Android Density
- Android Density
- Android Density
- Android Density
- android density
- probability density
- Graphics->Density
- Density 篇
- Android Density
- Codility-Peak
- 当我在做技术管理时,我在做什么?
- Java读取TXT内容
- Pycharm-快捷键
- Akka(0):聊聊对Akka的初步了解和想法
- web spring xsd 从 classpath加载
- Density Peak
- 卷积神经网络CNN(6)—— YOLOv2 参数详解
- java.util.ConcurrentModificationException
- Android启动流程分析之三:内核启动过程2--start_kernel
- qt 实现、区分鼠标单击,双击事件
- 总结】Android辅助功能(一)-AccessibilityEvent的分发
- python--selenium实用的自动生成测试HTML报告方法--HTMLTestRunner
- 从零开始学贪心算法
- ElasticSearch 的 聚合(Aggregations)