Machine Learning --5种距离度量方法
来源:互联网 发布:linux怎样启动tomcat 编辑:程序博客网 时间:2024/06/07 22:02
1 前言
在数据挖掘中,我们经常需要计算样本之间的相似度(Similarity ),我们通常的做法是计算样本之间的距离,本文对
距离计算方法做以下总结。
2 距离计算方法
A 欧式距离EuclideanDistance
欧式距离:两点之间的直线距离。
(1)二维平面上两点a(x1,y1),b(x2,y2)之间的欧式距离公式:
(2) n维空间上两点a(x1,x2……..xn),b(y1,y2……..yn)的欧式距离公式:
B 曼哈顿距离(ManhattanDistance)
曼哈顿距离也叫”曼哈顿街区距离”。想象你在曼哈顿街道上,从一个十字路口开车到另一个十字路口,驾驶距离就
是这个“曼哈顿距离”。
(1)二维平面上两点a(x1,y1),b(x2,y2)之间的曼哈顿距离公式:
(2) n维空间上两点a(x1,x2……..xn),b(y1,y2……..yn)的曼哈顿距离公式:
C 夹角余弦
机器学习中可以把两点看成是空间中的两个向量,通过衡量两向量之间的相似性来衡量样本之间的相似性。
(1)二维平面上两向量a(x1,y1),b(x2,y2)之间的夹角余弦公式:
也可直接通过向量运算:
(2) n维空间上两点a(x1,x2……..xn),b(y1,y2……..yn)的夹角余弦公式:
D 切比雪夫距离(Chebyshevdistance)
切比雪夫距离:各对应坐标数值差的最大值。国王从格子(x1,y1)走到格子(x2,y2)最少需要多少步?你会发现最少步
数总是max( | x2-x1 | , | y2-y1 | )步。
(1)二维平面上两点a(x1,y1),b(x2,y2)之间的切比雪夫距离公式:
(2) n维空间上两点a(x1,x2……..xn),b(y1,y2……..yn)的切比雪夫距离公式:
E 汉明距离
两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。
1011101与 1001001 之间的汉明距离是2
2143896与 2233796 之间的汉明距离是3
irie与 rise之间的汉明距离是 3
- Machine Learning --5种距离度量方法
- 距离度量方法
- 距离和相似性度量方法
- 机器学习——几种距离度量方法比较
- machine learning中的性能度量(Accuracy,Precision,Recall)
- Machine Learning---8--模型评估与分类性能度量
- 周志华《Machine Learning》学习笔记(2)--性能度量
- 距离和相似度度量方法
- 距离及相似度度量方法
- 课程小结——距离度量方法
- 距离和相似度度量方法
- 距离及相似度度量方法
- 距离度量
- 距离度量
- 距离度量
- Machine Learning---5--SVM
- 相似性度量方法(欧式距离等各种距离)
- 几种距离度量的异同
- @contextmanager:Python实现with结构的好方法
- ajax
- C++中int转化为string
- 一个偷偷写的svm库
- Python version 2.7 required, which was not found in the registry
- Machine Learning --5种距离度量方法
- MySQL5.7.13更改密码时出现ERROR 1054 (42S22): Unknown column 'password' in 'field list'
- jquery eval解析JSON中的注意点介绍
- 洛谷 P1070 道路游戏
- 数据结构-线性表
- php-beast加密php源码
- 93. Restore IP Addresses
- std::shared_ptr
- DOM 学习之—添加+-按钮