网格聚类算法(一)

来源:互联网 发布:淘宝客博主的收入 编辑:程序博客网 时间:2024/04/28 15:05

                基于网格的聚类算法


  前面的博文已经将划分、层次、密度的聚类算法讲了一下,接下来就是网格的方法。

  聚类算法很多,其中一大类传统的聚类算法是基于距离的,这种基于距离的聚类算法只能发现球状簇、处理大数据集以及高维数据集时,不够有效。另一方面发现的聚类个数往往依赖于用户参数的指定。这对用户来说是非常困难的。基于网格的聚类算法将空间量化为有限数目的单元,形成一个网格结构,所有聚类都在网格上进行。

  基于网格的聚类方法采用空间驱动的方法,把嵌入空间划分成独立于输入对象分布的单元。基于网格的聚类方法使用一种多分辨率的网络数据结构。它将对象空间量化成有限数目的单元,这些网格形成了网格结构,所有的聚类结构都在该结构上进行。这种方法的主要优点是处理速度快,其处理时间独立于数据对象数,而仅依赖于量化空间中的每一维的单元数。

  总结一下就是:将对象空间量化为有限数目的单元,形成一个网状结构,所有聚类都在这个网状结构上进行。

  基本思想就是将每个属性的可能值分割成许多相邻的区间,创建网格单元的集合(我们假设属性值是连续的,序数的,区间的)。每个对象落入一个网格单元,网格单元对应的属性空间包含该对象的值。

  后面的博文,我们将学习一下STING算法以及CLIQUE算法。


0 1
原创粉丝点击