基本聚类方法概述

来源:互联网 发布:php 模拟http 编辑:程序博客网 时间:2024/06/08 00:16

1:划分方法:只有一层,把n个对象的集合划分为k个分区,k<=n

k-均值 和 k-中心点算法,这些属于启发式聚类方法,适合于发现中小型的数据库中的球状互斥簇

2:层次方法:将数据库划分并分层

分为 凝聚 和分裂方法:

凝聚:把一个对象当成一个组,与最相近的那个对象组合成一个簇,之后迭代,直到所有的对象在一个簇里面或者达到停止条件而停止。因此也被称为自底向上的方法

分裂:把所有的对象放在一个簇里面,每次迭代之后,一个簇被分裂成几个小簇,直到每个对象一个簇为止或者簇内的对象彼此度充分相似。因此也被称为 自顶向下的方法

层次方法的缺陷:一旦一个步骤(凝聚或分裂)完成,就不能够撤销

3:基于密度的方法:

只要邻域中的点的密度(点的数目)超过某一个阀值,就继续增长给定的簇,这样的方法可以产生任意形状的簇。并且可以过滤噪声或离群点

4:基于网格的方法:

把对象空间量化为有限个单元形成一个网格结构。此方法可以与其他方法进行集成,处理速度快,独立于数据,但是依赖于网格大小

0 0