聚类算法综述(3)

来源:互联网 发布:p2p局域网限速软件 编辑:程序博客网 时间:2024/06/18 18:20
原文地址:聚类算法综述(3)作者:hyman

引用请注明出处:http://blog.sina.com.cn/s/blog_4c2cb83f0100ct0l.html

 

 我们知道对象之间的相异度是基于对象间的距离来计算的。最常用的度量方法是欧几里德距离,其形式如下:

d(i,j) =(|xi1-xj1|2+|xi2-xj2|2+……+|xip-xjp|2)1/2

这里i=xi1,xi2,……,xip)和j=xj1,xj2,……,xjp)是两个p维的数据对象。

曼哈坦距离的公式如下:

d(i,j)=|xi1-xj1|+|xi2-xj2|+……|xip-xjp|

上面的两个公式必须满足下面的条件:

 

d(i,j)0:距离非负。

d(i,i)=0:对象与自身的距离为0

d(i,j)=d(j,i):距离函数具有对称性。

d(i,j)d(i,h)+d(h,j):对象i到对象j的距离小于等于途经其他任何对象h的距离之和。

 

 

   明考斯基距离是以上两中距离计算公式的概括,其具体的公式如下:

d(i,j) =(|xi1-xj1|q+|xi2-xj2|q+……+|xip-xjp|q)1/q

q=1时该公式就是欧几里得距离公式;当q=2时,是曼哈坦距离公式。

 

原创粉丝点击