推荐系统:常用相似度计算方法

来源:互联网 发布:全球即时通讯软件排名 编辑:程序博客网 时间:2024/05/01 14:26

     by 雨水无香 

      不论是推荐系统,还是搜索引擎,都经常需要比较两个项目之间的相似度。常见的思想是将项目的特征的权值表示为N维空间向量,然后利用代数方法,对两个空间向量之间的距离、夹角等进行度量,从而表示相似度。常用的相似度计算方法有如下几种:

1.1 欧氏距离

      欧氏距离的计算中将空间向量看成是N维空间上的两个点,通过空间上两点之间的距离表示两个项目之间的联系。欧氏距离一般只用于简单的比较,并不能将值域投影到某一特定范围。

1.2 余弦相似度

      余弦相似度通过计算两个空间向量之间的夹角余弦来定义相似度,当用户未对该项评分时,认为该维的分量为0。余弦相似度计算时可先求出该项目的单位向量,继而只需要计算两个单位向量的内积即可得到其夹角余弦,减少计算量。

1.3 皮尔森相关系数

      皮尔森相关系数在打分制的体系中应用较广泛,但是只考虑两个空间向量都包含的维度进行计算,因此如果用于布尔类的兴趣体系(读过即为1,否则为0)其结果永远为0。皮尔森相关系数公式变形较多,是利用标准差的线性相关系数公式。

1.4 修正余弦相似度

      在余弦相似性度量方法中没有考虑不同用户的评分尺度问题,修正的余弦相似性度量方法通过减去用户对项目的平均评分来改善上述缺陷。

原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 pu鞋子蹭坏了怎么办 包的油边脱胶了怎么办 pu包有点破皮怎么办 买房子不给过户怎么办 布艺床头有味道怎么办 皮革床头爆皮了怎么办 皮包用酒精擦了怎么办 床头靠背皮掉了怎么办 真皮床头爆皮了怎么办 半裙拉链往下滑怎么办 误用三氧化二砷怎么办 情侣之间感情淡了怎么办 雪纺布料刮坏了怎么办 棉麻布料坏了怎么办 主板针脚弯了怎么办?能修吗? 脸颊两侧毛孔大还有黑头怎么办 脸颊和鼻子粗毛孔大怎么办 十二时辰对照五脏养生在国外怎么办 在学校接吻怕被看到怎么办 楼房圈梁被破坏了怎么办 买了农村的房子怎么办 邻居建房不用共用墙怎么办 腿被蚂蚁咬了怎么办 火车订2票不挨着怎么办 手机全变成英文该怎么办 这些旧电脑该怎么办用英语翻译 落水已把人救出该怎么办 手机落水后已开过机怎么办? 车被洪水冲走了怎么办 感到生活无聊无事可干怎么办 邻居不除排水沟影响到自己怎么办 开过光的玉碎了怎么办 一脚刹车踩到底怎么办 p53基因型cc型该怎么办 人不小心掉进火山怎么办 奥林巴斯相机相片被锁了怎么办 文明53格外的奢侈品怎么办 答应了要请客钱不够怎么办 在家里面着急没办法干活怎么办 1岁宝宝脾气暴躁怎么办 档案不在中国海峡人才市场怎么办