推荐算法中的 相似度计算
来源:互联网 发布:软件项目水果商场 编辑:程序博客网 时间:2024/06/02 01:21
对用户的行为进行分析得到用户的偏好后,可以根据用户的偏好计算相似用户和物品,然后可以基于相似用户或物品进行推荐。这就是协同过滤中的两个分支了,即基于用户的协同过滤和基于物品的协同过滤。
关于相似度的计算,现有的几种方法都是基于向量(Vector)的,其实也就是计算两个向量的距离,距离越近相似度越大。在推荐场景中,在用户-物品偏好的二维矩阵中,我们可以将一个用户对所有物品的偏好作为一个向量来计算用户之间的相似度,或者将所有用户对某个物品的偏好作为一个向量来计算物品之间的相似度。
1.同现相似度
计算公式为:
分母|N(i)|是喜欢物品i的用户数,而分子|N(i)∩N(j)|是同时喜欢物品i和物品j的用户数据。
为了防止j为热门物品,修正为:
2.欧式距离相似度
最初用于计算欧几里得空间中的两个点的距离,假设x、y是n维空间的两个点,它们之间的欧几里得距离是:
可以看出,当n=2时,欧几里得距离是平面上的两点的距离。
当用欧几里得距离表示相似度时,一般采用一下公式进行转换:距离越小,相似度越大。
3.Cosine相似度
Cosine相似度被广泛应用于计算文档数据的相似度:
阅读全文
0 0
- 推荐算法中的 相似度计算
- 推荐算法中的 相似度计算
- spark mllib 中的tf-idf算法计算文档相似度
- [推荐系统]余弦计算相似度度量
- tfidf算法+余弦相似度算法计算文本相似度
- Mahout推荐引擎中的几种相似度计算简要介绍
- 推荐算法之Jaccard相似度与Consine相似度
- 推荐算法基础--相似度计算方法汇总
- 推荐算法之余弦相似度
- 推荐系统中的相似度度量
- mahout中的相似度算法
- lucene计算文本相似度算法
- lucene计算文本相似度算法
- 余弦方法计算相似度算法实现
- 计算两个字符串相似度的算法
- 计算字符串相似度算法 Levenshtein
- lucene计算文本相似度算法
- 余弦方法计算相似度算法实现
- mongodb设置auth认证
- 浅析python 中__name__ = '__main__' 的作用
- 注册表操作函数
- mybatisGenerator 代码自动生成报错 Result Maps collection already contains value for BaseResultMap
- 35_面向对象_08_方法重载_构造方法重载
- 推荐算法中的 相似度计算
- 使用python删除本地夹里重复的文件
- 将Centos的yum源更换为阿里云源
- java web week_five 多线程作业
- gcc 版本下载地址和编译依赖库
- STL案例之学校演讲比赛
- 基于Netty4的HttpServer和HttpClient的简单实现
- 输入任意两正整数,获取该区间所有素数
- Fragment的基本概述