dbscan算法
来源:互联网 发布:数据库远程连接错误26 编辑:程序博客网 时间:2024/05/22 02:19
dbscan算法是一种基于密度的聚类算法。
该算法的目的在于过滤低密度区域,发现稠密度样本点,跟传统的基于层次聚类和划分聚类的凸形聚类簇不同,该算法可以发现任意形状的聚类簇,与传统的算法相比它有如下优点:
与K-means比较起来,你不必输入你要划分的聚类个数;
聚类簇的形状没有bias;
可以在需要时输入过滤噪声的参数;
DBSCAN中的的几个定义:
Ε领域:给定对象半径为Ε内的区域称为该对象的Ε领域
核心对象:如果给定对象Ε领域内的样本点数大于等于MinPts,则称该对象为核心对象。
直接密度可达:对于样本集合D,如果样本点q在p的Ε领域内,并且p为核心对象,那么对象q从对象p直接密度可达。
密度可达:对于样本集合D,给定一串样本点p1,p2….pn,p= p1,q= pn,假如对象pi从pi-1直接密度可达,那么对象q从对象p密度可达。
密度相连:对于样本集合D中的任意一点O,如果存在对象p到对象o密度可达,并且对象q到对象o密度可达,那么对象q到对象p密度相连。
可以发现,密度可达是直接密度可达的传递闭包,并且这种关系是非对称的。密度相连是对称关系。DBSCAN目的是找到密度相连对象的最大集合。
Eg:假设半径Ε=3,MinPts=3,点p的E领域中有点{m,p,p1,p2,o},点m的E领域中有点{m,q,p,m1,m2},点q的E领域中有点{q,m},点o的E领域中有点{o,p,s},点s的E领域中有点{o,s,s1}.
那么核心对象有p,m,o,s(q不是核心对象,因为它对应的E领域中点数量等于2,小于MinPts=3);
点m从点p直接密度可达,因为m在p的E领域内,并且p为核心对象;
点q从点p密度可达,因为点q从点m直接密度可达,并且点m从点p直接密度可达;
点q到点s密度相连,因为点q从点p密度可达,并且s从点p密度可达。
算法描述
算法:DBSCAN
输入:E— 半径
输出:目标类簇集合
方法:repeat
1)
2)
- dbscan算法
- dbscan算法
- dbscan算法
- dbscan算法
- DBSCAN算法
- DBScan 算法
- DBSCAN算法
- DBSCAN算法
- DBSCAN算法
- DBSCAN算法
- DBScan算法
- 聚类算法:DBSCAN
- DBSCAN算法详解
- python dbscan算法
- DBSCAN聚类算法
- 聚类-DBSCAN算法
- DBSCAN 聚类算法
- DBSCAN聚类算法
- Python 编码时应该注意的几件事情
- ce6.0对mfc的支持
- poj 1218 THE DRUNK JAILER
- 教你卸载oracle
- ARM 映象文件及执行机理
- dbscan算法
- Linux下文件和目录的颜色代表的含义
- dom4j写文件的编码问题(主要指中文)的解决
- Javascript 关于Cookie
- java反编译jad与jadeclipse
- html&xhtml笔记整理归类
- C语言的布尔类型
- Android 如何在自己的应用中模拟Home键
- AJAX 缓存问题的两种解决方法(IE)