推荐系统导论笔记(六)
来源:互联网 发布:标致pp2000软件下载 编辑:程序博客网 时间:2024/06/06 05:15
从Non-Personalize Recommendation到User-User Collaborative Filtering
考虑这样一个最简单的问题:向一个用户
- 考虑评分用户与目标用户的相似度
- 考虑用户的评分习惯
对于第一个问题,我们建立一个通用的模型,即:
用户间的相似度
事实上,Pearson系数就是余弦系数去中心化的结果,因此,可以视作余弦相似度的一个 特殊情况。
若用户
第二个问题主要是由于用户评分习惯不同导致的。有些用户习惯打高分,评分均值较高,而有些用户习惯打低分,评分均值较低。为了避免这一情况对预测结果的影响,我们可以用所谓的去中心化来解决。即用评分值减去用户评分均值得出评分偏移代替原评分进行计算,即:
User-User CF使用注意事项及其缺点
加权邻居个数的选择
在User User CF算法中,邻居用户是用来计算加权评分的。一般邻居用户的选择方法有如下几种:
- 所有邻居
- 相似度(或者距离)超出某一阈值的邻居
- 随机选择的邻居
- Top N的邻居
从理论上来说,邻居越多,预测结果越精确,但在实际中,不相似的用户可能会带来大量的噪声,使得预测的精确度变低,因此一般选择25~30个邻居用户较为合适。
评分正则化
正如上文所述,用户评分习惯的不同,导致了用户评分分布的不同,而这种不同会对我们最终的预测结果造成较大的影响。除了上文提到的去中心化这一方法之外,还可以使用Z score进行正则化,z score的定义如下:
缺点分析
User User CF算法的一个最主要的缺点是计算复杂度。假设现在有
尽管可以通过缓存或者减少邻居个来尽可能减少计算量,性能问题仍然是User User CF的一个瓶颈。
1 0
- 推荐系统导论笔记(六)
- 推荐系统导论笔记(六)——Assignment3
- 推荐系统导论笔记(一)
- 推荐系统导论笔记(二)
- 推荐系统导论笔记(四)
- 推荐系统导论笔记(七)
- 推荐系统导论笔记(三)——Assignment 1
- 推荐系统导论笔记(五)——Assignment 2
- 明大推荐系统导论笔记 week 1
- 明大推荐系统导论笔记 week 2
- 算法导论学习笔记(六):计数排序与基数排序
- 计算机科学与Python编程导论_MIT 学习笔记(六)
- 推荐系统-笔记(下)
- 堆排序-《算法导论》学习笔记六
- 个性化推荐系统(六)--- 超大数量业务个性化实战
- 【推荐系统算法】推荐引擎算法学习导论
- 【推荐系统算法】推荐引擎算法学习导论
- 推荐系统学习笔记(一)介绍
- ubuntu14.04密码正确,进入不了图形界面
- 【Unity开发】简单的对象池实现
- leetcode -- Plus One--与add binary类似--要了解
- (一)使用RED5搭建流媒体服务器
- mybatis实战教程之开发环境搭建、以接口的方式编程、实现数据的增删改查
- 推荐系统导论笔记(六)
- leetcode之Burst Balloons
- python 中 类, 模块, 包的组织
- 实时监听textField的值改变事件
- uva 1077 - The Sky is the Limit(离散化)
- 高精度加法
- 二分问题
- 有符号与无符号
- 简单Prim()算法