mahout读书笔记 -- 聚类(4)

来源:互联网 发布:t淘宝客 顾客部分退款 编辑:程序博客网 时间:2024/05/16 05:20

相似性度量:

1:Euclidean distance measure,直观看就是两点直连距离

2:Squared Euclidean distance measure,和类别1的不同就是它不开方了

3:Manhattan distance measure,两点之间的折线距离,蚂蚁爬台阶的距离

4:Cosine distance measure,可以看成两点与原点相连向量夹角,缺点是没有考虑长度影响

5:Tanimoto distance measure,结合了Cosine和Euclidean

6:Weighted distance measure,可以对vector某一维增加权重参数

原创粉丝点击