层次聚类简介

来源:互联网 发布:雅思口语怎么提高 知乎 编辑:程序博客网 时间:2024/06/06 08:23

层次聚类简介

概念

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,类中的对象彼此间相似度大,而类与类之间的相似度小。

层次聚类,是一种很直观的算法。顾名思义就是要一层一层地进行聚类,可以从下而上地把小的cluster合并聚集,也可以从上而下地将大的cluster进行分割。似乎一般用得比较多的是从下而上地聚集,因此这里主要介绍一种。所谓从下而上地合并cluster,具体而言,就是每次找到距离最短的两个cluster,然后进行合并成一个大的cluster,直到全部合并为一个cluster。整个过程就是建立一个树结构,类似于下图。




具体分析见该文