Density Peak改进(PCA/KNN)

来源:互联网 发布:java岗位管理制度 编辑:程序博客网 时间:2024/05/18 03:10

参考文献:Study on Density Peaks Based on K-Nearest Neighbors and Principal Component Analysis (KBS2016 C类期刊)

1、改进:

  • DPC(Density Peak Clustering)考虑的是数据的全局结构,在计算局部密度ρ时未考虑数据的局部特征,因此在目睹不均匀时,DPC效果不好(如Jain数据集) <—-KNN
  • 当数据是高维时,DPC效果不好、因为在高位数据中有许多维是不相关的,这些不相关的维会使DPC将其当作噪声。维度越高,距离度量会变得越来越没有意义 <—–PCA

2、方法
先使用PCA降维,再根据DPC聚类,ρ的计算借助于KNN:
这里写图片描述
其中,KNN(xi)表示xi的k的最近邻,k=p*N(N表示节点数,p表示percentage)

3、效果
改进后,在flame数据集上,效果明显变好
这里写图片描述

0 0