距离与相似度度量
来源:互联网 发布:新东方多媒体数据库 编辑:程序博客网 时间:2024/06/05 15:17
距离与相似度度量
在机器学习过程中,经常要用到各种距离或者相似度度量公式来处理各种信号的数据,比如在基于Wi-Fi指纹的室内定位过程中,计算实时Wi-Fi数据和指纹库中各个Wi-Fi指纹的相似程度,假设
1. 曼哈顿距离(Manhattan Distance)
曼哈顿距离的正式意义为
2. 欧氏距离(Euclidean Distance)
欧氏距离是最常用的距离计算方式之一,它源自于欧氏空间中两点间的距离公式,向量
3. 切比雪夫距离(Chebyshev Distance)
切比雪夫距离或者$L_1$
度量,定义为两个向量中各个维度坐标值差的最大值,对于向量
4. 明氏距离(Minkowski Distance)
明氏距离准确的说是一组距离的定义,它是对于欧氏距离的推广,对于向量
- 其中
- 当
- 当
- 当
明氏距离,包括曼哈顿距离、欧氏距离和切比雪夫距离,存在着明显的缺点,简单说来就是将多维空间中各个维度的量纲(Scale)当作相同的值来看待,并且没有考虑各个维度上变量取值的分布情况,如期望和方差等。
5. 马氏距离(Mahalanobis Distance)
考虑到欧氏距离无法忽略各个维度的量纲差异,所以我们在使用欧氏距离之前一般需要对各个维度的数据进行标准化(Normalize),这进而衍生出了另外一个距离度量——马氏距离。
假设
若协方差矩阵为单位矩阵,也就是各个样本向量之间独立同分布,则马氏距离就变成了上述欧式距离的向量形式;若协方差矩阵是对角矩阵,马氏距离就变成了标准化欧式距离。
6. 其他距离
在几何中夹角余弦可以用来衡量
杰卡德距离(Jaccard Distance)用两个集合不同元素占所有元素的比例来衡量,对于两个不同的集合
两个字符串
- 距离与相似度度量
- 数学距离与相似度度量
- 相似度度量 距离
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- 距离和相似度度量
- linux shell之alias(别名)
- maven 不再支持源选项 1.5。请使用 1.6 或更高版本。
- 购物
- 怎样实现页面的快速加载???
- 创建tornado应用输出hello world
- 距离与相似度度量
- 二叉树遍历
- 权限
- Ubuntu 16.04 Python读取MySQL数据库中文乱码的问题
- 矩阵中的路径
- VIP视频会员,无限制看剧对人的自制力,产生了严重的考验和折磨
- 【矩阵论】线性变换及其矩阵
- c++指针学习
- bzoj1003: [ZJOI2006]物流运输