推荐系统:常用相似度计算方法
来源:互联网 发布:全球即时通讯软件排名 编辑:程序博客网 时间:2024/05/01 14:26
by 雨水无香
不论是推荐系统,还是搜索引擎,都经常需要比较两个项目之间的相似度。常见的思想是将项目的特征的权值表示为N维空间向量,然后利用代数方法,对两个空间向量之间的距离、夹角等进行度量,从而表示相似度。常用的相似度计算方法有如下几种:
1.1 欧氏距离
欧氏距离的计算中将空间向量看成是N维空间上的两个点,通过空间上两点之间的距离表示两个项目之间的联系。欧氏距离一般只用于简单的比较,并不能将值域投影到某一特定范围。
1.2 余弦相似度
余弦相似度通过计算两个空间向量之间的夹角余弦来定义相似度,当用户未对该项评分时,认为该维的分量为0。余弦相似度计算时可先求出该项目的单位向量,继而只需要计算两个单位向量的内积即可得到其夹角余弦,减少计算量。
1.3 皮尔森相关系数
皮尔森相关系数在打分制的体系中应用较广泛,但是只考虑两个空间向量都包含的维度进行计算,因此如果用于布尔类的兴趣体系(读过即为1,否则为0)其结果永远为0。皮尔森相关系数公式变形较多,是利用标准差的线性相关系数公式。
1.4 修正余弦相似度
在余弦相似性度量方法中没有考虑不同用户的评分尺度问题,修正的余弦相似性度量方法通过减去用户对项目的平均评分来改善上述缺陷。
- 推荐系统:常用相似度计算方法
- 常用相似度计算方法
- [推荐系统]Mahout中相似度计算方法介绍
- 推荐算法基础--相似度计算方法汇总
- [推荐系统]mahout中实现的几种相似度计算方法
- 推荐系统中常见的几种相似度计算方法和其适用数据
- 推荐系统中的相似度计算方法总结及实现代码(python)
- 推荐系统 - 1 - 相似度
- 图像相似度计算方法
- 相似度计算方法总结
- 相似度计算方法
- 相似度计算方法
- 图像相似度计算方法
- 常用的相似度计算方法原理及实现
- 推荐系统中的相似度度量
- [推荐系统]余弦计算相似度度量
- 推荐系统之UserCF1:用户相似度
- 词语相似度计算方法总结
- dbms_xplan之display_cursor函数的使用
- ZZ 查看nginx,apache,mysql,php编译参数
- Windows GUI 窗体的子类化和超类化
- 要养成良好的书写Sql的习惯 .
- 开发人员一定要加入收藏夹的网站(.NET JAVA SQL等)
- 推荐系统:常用相似度计算方法
- 项目
- 中嵌内核4天总结
- IE浏览器和Firefox下的HTTP调试工具
- xml读取异常Invalid byte 1 of 1-byte UTF-8 sequence
- Windows系统下CMD添加删除用户、用户组
- Asp.net + js 异步上传文件的例子 - 使用iframe实现
- 窗口刷新问题(WM_PAINT、BeginPaint、EndPaint的说明)
- 术语随想