聚类算法综述(4)

来源:互联网 发布:p2p局域网限速软件 编辑:程序博客网 时间:2024/06/16 02:58
原文地址:聚类算法综述(4)作者:hyman

2.2.2二元变量

二元变量只有01两个状态,0表示变量为空,1表示该变量存在。

 

 

 

对象j

 

 

1

0

Sum

对象i

1

q

r

q+r

0

s

t

s+t

Sum

q+s

r+t

p

 

p=q+r+s+t

二元变量中基于对称的二元变量的相似度称为恒定相似度,这里有最著名的简单匹配系数来评价两个对象之间的相似度,其定义如下:

dij=r+s/q+r+s+t

基于不对称的二元变量的相似度称为非恒定相似度,最著名的评价系数是Jaccard系数,形式如下:

dij=r+s/q+r+s

这里负匹配的数目t被认为是不重要的,所以省略。

 

原创粉丝点击