聚类算法综述(2)
来源:互联网 发布:p2p局域网限速软件 编辑:程序博客网 时间:2024/06/18 07:02
(4)结果验证。一旦用聚类算法得到结果,就需要验证其正确性。
(5)结果判定。在许多情况下,应用领域的专家必须用其他实验数据和分析判定聚类结果,最后做出正确的结论。
聚类分析有很多种算法,每种算法都是优化了某一方面或某几方面的特征。聚类算法的优劣标准本身就是一个值得研究的问题,对于聚类的评价有不同的标准。现在通用的聚类算法都是从几个方面来衡量的,而没有完全使用量化的客观标准。下面给出六条关于聚类的主要标准:
(1)处理大的数据集的能力。
(2)处理任意形状,包括有间隙的嵌套的数据的能力。
(3)算法处理的结果与数据输入的顺序是否相关,也就是说算法是否独立于数据输入顺序。
(4)处理数据噪声的能力。
(5)是否需要预先知道聚类个数,是否需要用户给出领域知识。
(6)算法处理有很多属性数据的能力,也就是对数据维数是否敏感。
对于一个聚类算法可以从以上几个方面综合考虑。
2.2 聚类方法的数据结构
基于内存的聚类算法有以下两种代表性的数据结构:
数据矩阵(对象与变量结构):它用p个变量表现n个对(1)
x11 … x1f … x1p
xi1 … xif
xn1 … xnf … xnp
(2)
0
d(2,1)0
d(3,1)d(3,2)0
d(n,1)d(n,2)… … 0
这里d(i,j)是对象i和对象j之间相异性的量化表示,通常为非负值,当两个对象i,j越相似,其值越接近0;反之,则值越大。
2.2.1 区间标度变量
(1)计算平均的绝对偏差Sf:
Sf
这里x1f,……,xnf是f的n个度量值,mf是f的平均值。
(2)计算标准化的度量值:
Zif = (xif-mf)/sf
- 聚类算法综述(2)
- 聚类算法综述
- 聚类算法综述
- 聚类算法综述
- 聚类算法综述(1)
- 聚类算法综述(3)
- 聚类算法综述(4)
- 聚类算法综述(4)
- 聚类算法综述(5)
- 聚类算法综述(6)
- 聚类算法综述(7)
- 聚类算法综述(1)
- 海量数据聚类算法综述 (转)
- 海量数据聚类算法综述
- 数据挖掘中的聚类算法综述
- 推荐算法综述2
- 排序算法(综述)
- 数据压缩算法综述(摘录)
- 如何在Linux使用Eclipse +&nb…
- 明天你还在
- 聚类算法综述(1)
- predis的使用
- Android网络防火墙实现初探
- 聚类算法综述(2)
- c语言基础 (6) 指针
- 聚类算法综述(3)
- 界面原型设计工具
- 聚类算法综述(4)
- 界面原型设计工具(2)
- 聚类算法综述(4)
- Android ListView分组布局改进
- 聚类算法综述(5)