DBSCAN 算法初探

来源:互联网 发布:php命令行 编辑:程序博客网 时间:2024/05/29 11:46

一种用于聚类的常用算法,相较于Kmeans,优点有:

无需事先指定聚类组数

对噪声不敏感

对原始数据集的分布要求低


缺点:

数据量较大时处理速度慢


原理详解:

http://shiyanjun.cn/archives/1288.html


初级使用方法(主要是调参):

http://www.cnblogs.com/pinard/p/6217852.html

以上链接也给出了一种比较典型的不太适合使用k-means进行聚类的数据集分布情况

http://blog.csdn.net/sandyzhs/article/details/46773731


Python实现:

http://www.cnblogs.com/wsine/p/5180778.html


C++实现:

http://blog.csdn.net/k76853/article/details/50440182



原创粉丝点击