模式识别相似性测度距离计算---夹角余弦和特征二值得夹角余弦

来源:互联网 发布:js菜单滑动自动 编辑:程序博客网 时间:2024/06/05 17:51
向量空间余弦相似度(Cosine Similarity)
余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。

向量空间余弦相似度理论就是基于上述来计算个体相似度的一种方法。下面做详细的推理过程分析。

如果向量a和b不是二维而是n维,上述余弦的计算法仍然正确。假定a和b是两个n维向量,a是 ,b是 ,则a与b的夹角 的余弦等于:

cosA=[(x1)*(x2)+(y1)*(y2)]/{根号下[(x1)^2+(y1)^2]*根号下[(x2)^2+(y2)^2]}


余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,夹角等于0,即两个向量相等,这就叫"余弦相似性"。

对于二值得只是其中向量每个分量的取值只能为0或者1和一般的情况计算过程一样。

0 0