mahout中得距离测度
来源:互联网 发布:资海网络集团员工待遇 编辑:程序博客网 时间:2024/05/22 13:11
假设向量1为(a1,a2,...an)
向量2为(b1,b2,...bn)
1、欧式距离测度
公式为
d=sqrt((a1-b1)^2+(a2-b2)^2+…+(an-bn)^2)
mahout类为EuclideanDistanceMeasure
2、平方欧式距离测度
公式为
d=(a1-b1)^2+(a2-b2)^2+…+(an-bn)^2
mahout类为SquaredEuclideanDistanceMeasure
3、曼哈顿距离测度
公式为
d=|a1-b1|+|a2-b2|+…+|an-bn|
mahout类为ManhattanDistanceMeasure
4、余弦距离测度(将向量看成几何中向量,两个向量的余弦夹角,即为它们的距离)
公式为
d=1-(a1b1+a2b2+…+anbn)/(sqrt(a1^2+a2^2+…+an^2)*sqrt(b1^2+b2^2+…+bn^2))
注意:这种距离测度不考虑两个向量的长度,只关注从原点到这两个点的方向。距离测度范围为(0.0到2.0)
mahout类为CosineDistanceMeasure
5、谷本距离测度
余弦距离测度忽略向量长度,在某些情况下不适应,而谷本距离测度既会考虑向量长度,也会考虑向量夹角
公式为:
d=1-(a1b1+a2b2+…+anbn)/(sqrt(a1^2+a2^2+…+an^2)*sqrt(b1^2+b2^2+…+bn^2)-(a1b1+a2b2+…+anbn))
mahout类为TanimotoDistanceMeasure
6、加权距离测度
此种测度可以修改某一维度的权重,比如在x-y坐标系中希望x方向的影响力加倍,就可以设置该维度权重为2。
mahout类为WeightedDistanceMeasure。
- mahout中得距离测度
- mahout学习之聚类(1)——向量的引入与距离测度
- 范数、测度和距离.
- 模式相似性测度-距离
- 常用的距离测度
- Mahout中相似度距离计算方法总结
- 模式识别相似性测度距离计算---欧式距离
- 模式识别相似性测度距离计算---tanimoto距离
- 模式识别经常用到的距离测度
- 一种改进的余弦距离测度
- 数据挖掘/机器学习 之 距离测度
- 测度
- 模式识别相似性测度距离计算---马氏距离
- 模式识别相似性测度距离计算---几种距离对比
- Mahout系列之----距离度量
- Mahout--数据点间的距离计算方法
- 世界上最遥远得距离
- 模式识别相似性测度距离计算---夹角余弦和特征二值得夹角余弦
- Tachyon学习及源码阅读:简介
- ORA-01591 锁被未决分布式事务处理
- 黑马程序员——java基础——网络编程
- [LeetCode]Interleaving String
- kinetic学习之(三) UART
- mahout中得距离测度
- Python 中的range(),arange()函数
- Pow(x, n)
- SDUTOJ 2482 二叉排序树
- CSS学习笔记三
- 安卓4.0蓝牙开发
- 细探颜色值
- asp.net--站点架构(页脚设计)和配色与样式统一设定
- HDU 4715 Difference Between Primes(数学啊)