Density Peak改进(Hierarchical)
来源:互联网 发布:北京宇信科技集团知乎 编辑:程序博客网 时间:2024/05/16 17:59
参考文献:DenPEHC-Density peak based efficient hierarchical clustering(Information Sciences 2016 B)
1、改进:
- DPC是划分聚类(flat clustering),不能发现群组的层次结构
- 能够对大规模、高维数据集(LSHD)进行聚类
2、主要思想
- 利用
- 根据
- 使用grid granulation,使得DPC能够处理大规模、高维数据
3、DenPEHC
首先选择所有潜在的聚类中心,然后在 γ曲线中确定stairs,最后每一层的中心被用于将leading tree转换成森林,森林中每一颗子树代表一个聚类。
一些符号定义:
3.1、确定聚类中心
- 将γ倒序排序:
- 对i=N-FitLen–>0,用节点索引为i后的FitLen个点进行线性拟合,求出ai,bi:
- 求出ai,bi后估计,,当且时,检测聚类中心的过程停止,
【gamma是按照降序排列的,由于是从尾到头开始拟合,当为预测出的gamma值与实际的gamma值差距较大值时,说明
3.2、确定stairs
如果
【a steep decrease must occur at the beginning of a stair, and the decrease in γ within the stair is gentle】
γ最大的点单独不能构成一个stair,γ最大的点可能单独构成一个stair。如下图所示,红色的矩形框代表一个stair。
3.3、leading tree
由于DPC根据每个点的parent(Nn)加入到相应的聚类中,因而构成一棵树,称为leading tree。将以聚类中心为根节点的子树分离出来,就构成了一个聚类。
3.4、DenPEHC的聚类过程
- 计算
ρ⃗ 和Nn→ - 通过线性拟合的方法找到所有潜在的聚类中心
- 分析聚类中心的γ曲线找到stairs
- 构造leading tree
- 一步步增加stair,构造不同层次的聚类
3.5、异常点检测
计算
4、DenPEHC聚类大规模、高维数据
流程图如下,黑色和白色箭头代表第一轮,绿色箭头表示第而二轮
使用grid granulation后,距离计算:
其中,
- Density Peak改进(Hierarchical)
- Density Peak改进(overlapping)
- Density Peak改进(PCA/KNN)
- Density Peak
- Graphics->Density (上)
- Graphics->Density (下)
- 文献阅读笔记——Clustering by fast search and find of density peak
- 【论文学习笔记】Clustering by fast search and find of density peak
- peak finder(找峰点)
- 聚类(4)-- Hierarchical clustering
- 分层查询(Hierarchical Queries)
- 直方图 density(密度)解释
- Android(density屏幕密度)
- zoj 3826 Hierarchical Notation(模拟)
- 层次聚类方法(Hierarchical Clustering)
- Angular2(七)--Hierarchical dependence injection
- Hierarchical Clustering(层次聚类)
- Pixel density(简单的字符串处理)
- JNI简单使用之一:JAVA调用C/C++
- 最短路练习11/poj/3159 【差分约束系统】Candies
- 如何在android studio建立module,然后实现不同module间的工程依赖
- Centos 安装redis
- 磁盘加密与其自动挂载及加密清除
- Density Peak改进(Hierarchical)
- Java -> 内部类与匿名内部类
- IplImag、HImage相互转换
- 深度学习笔记三-卷积神经网络中的部分问题
- 字典树的题目 找了个时间刷了一点字典树的题目
- Toolbar基本使用
- 系统调用sys_write的过程
- 求助这个netflow数据都代表什么。
- iOS的崩溃率高于Android?来自听云的数据告诉你真相