机器学习与智能优化 之 自顶而下聚类:K均值

来源:互联网 发布:网站特效源码 编辑:程序博客网 时间:2024/05/01 11:59

要点

无监督学习构建模型仅仅通过输入数据,而不用借助分类标签。特别地,聚类旨在将相同类别的物体放到相同的类中,不同的物体放到不同的类中。聚类启动的信息可以是一组点之间的关系(外在表示)或者表示独立点的一组向量(内在表示)。在第二种情况中,一个均值向量可以作为聚类成员的中心。

聚类的目标有:通过抽象压缩信息(考虑组而不是单个成员),了解实验点的全局结构(实验点并不是在输入空间上随机分布的而是聚在有选择的区域),使用聚类中心降低认知负担。

没有独立的最佳聚类评价标准,有趣的结果由相似度测量方法和后续步骤中组之间的关联决定。一言以蔽之,同一个聚类成员之间高相似性,不同聚类之间高差异性。

自顶向下的聚类首先选择指定的聚类数目,然后分割样本。K均值先确定K个中心位置,将样本归类到离它们最近的中心,通过样本均值重新计算中心再重新归类……

聚类让你从一个新的角度看待你的宠物狗托比。狗是有四个爪子,会叫高兴的时候会摇尾巴的器官聚类。托比是与你最喜爱的小宠的经历与情感的聚类。


0 0