层次聚类算法--AGENES

来源:互联网 发布:超级软件txt下载 编辑:程序博客网 时间:2024/04/30 11:51
1.层次聚类:什么叫层次聚类?层词聚类算法是将所有的样本点自底而上合并成一棵树或者自顶而下分裂成一棵树的过程。这两种方法分别叫做凝聚和分裂。
2.agenes算法是凝聚的一种。算法思想,首先将每一个原始数据作为一个类如,A={{a},{b},{c},{d},{e}...},这是第一步,然后计算A里所有类之间的距离,找到其中相似度最大的两个类合并起来成为一个类,然后将这个类放在A里替代原来的两个类。接着重复第二步的操作,直到类之间的最大距离小于某一个阈值结束。
     示意图:
      
层次聚类算法--AGENES
3:优点:这种方法可以发现非球类的簇。
 缺点:1)时间:O(n2
       2)不具有再分配能力,即如果样本点A在某次迭代过程中已经划分给类簇C1,那么在后面的迭代过程中A将永远属于类簇C1,这将影响聚类结果的准确性。
      3)在合并类的时候,因为在聚类的过程中,每个类的大小越来越大,因此,每次合并必须对类里面的元素进行整理的工作。


















0 0
原创粉丝点击