推荐算法

来源:互联网 发布:手机mac过滤怎么设置 编辑:程序博客网 时间:2024/05/21 20:46

一、协同过滤推荐算法(基于用户):
定义:在用户行为中寻找特定模式,用以创建用户专属的推荐内容
输入:只取决于使用数据(如:评价,购买,下载,用户偏好)
类型:
(1)基于相似类型的协同过滤(比如基于兴趣类似的用户或者基于类似用户的物品)
用户对物品的评分可直接用以预测新物品的评分,用户喜欢物品A,那么可能就会喜欢与物品A类似的物品
基于用户:对物品有着相似品味的用户,你喜欢的我可能也会喜欢(通过对物品的一些评分等信息来计算余弦相似性)
这里写图片描述
相似性矩阵:
这里写图片描述
根据相似用户进行评分预测
这里写图片描述
基于物品:对单个用户,购买了A,也可能会购买与A类似的B(分析过程与同上,只不过对象改成了书籍,书籍的相似矩阵)
(2)基于模型的协同过滤(矩阵因子分解,受限玻尔兹曼机,贝叶斯网络等)
通过机器学习,在数据中找出模式,并将用户与物品间的互动方式模式化,输入特征,来输出评分。
优点:
(1)不需要对预知识有太深的了解
(2)无需了解用户及物品的特性
缺点:
(1)需要标准化的产品
(2)对于用户与物品的比率需求高(1:10),即用户需求量比较大
(3)会受流行度的影响
(4)无法推荐用户未评价或者未使用过的物品
本质上:给用户推荐之前浏览,点击,收藏的内容或相似的内容

二、基于内容过滤的推荐算法:
定义:根据用户过去喜欢的物品,推荐元数据,描述,主题等类似的物品,基于物品本身的内容(如年份,标题,描述),而不是用户对物品的反馈
输入:仅取决于物品及用户的内容/描述(但不包括使用数据)
类型:
(1)信息检索
(2)机器学习(朴素贝叶斯,支持向量机,决策树等)
优点:
(1)无需使用数据
(2)不存在流行度偏好,可以根据罕见特性推荐物品
(3)可以通过用户内容特性来解释
缺点:
(1)物品内容要能输入到机器中
(2)容易局限化用户的分类
(3)很难将多个物品的特征组合在一起
本质上:基于用户和物品的关联程度,来给特定用户推荐相似物品(没有使用用户行为数据)
三、混合方式的推荐算法:
定义:结合协同过滤()与基于内容过滤两种方式,以利用某个算法的优点解决另一个算法的缺点
输入:通过用户/物品内容特征(用户和物品的关联度)及使用数据(用户对物品的反馈)以借助这两类数据的优势
类型:权衡,切换,混合,特性结合,级联,特性增强
优点:
(1)无流行度偏颇,可推荐罕见特性的物品
(2)可实现多样化
缺点:
(1)不好平衡
本质上:可以认为是协同过滤和基于内容的推荐
四、流行度推荐算法
定义:根据流行度来推荐物品的算法(如下载,观看,影响度较高的)
输入:使用数据与物品内容(分类)
优点:
(1)容易实现
(2)基准算法优秀
缺点:
(1)需要标准化产品
(2)不会推荐新物品,推荐列表变动不会太大(很少会推荐流行度不高,但是有人喜欢的物品)
本质上:谁流行推荐谁
五、高级或“非传统”推荐算法
类型:深度学习,学习排名,情景感知推荐,社会化推荐
优点:
(1)使用新技术
缺点:
(1)不适合作为推荐系统的首要推荐算法
本质上:利用新技术实现推荐系统

总而言之,基础的推荐算法就两种,1.基于协同过滤(基于用户,基于内容),2.基于内容推荐,其他的实际上是两种基础推荐算法的加权,只不过加权方式不同

原创粉丝点击