推荐系统

来源:互联网 发布:工商网络监管 编辑:程序博客网 时间:2024/06/05 11:54

1.推荐系统的输入

推荐系统可能的输入数据及其形式多种多样,输入归纳起来可以分为用户、物品和评价三个方面,分别对应一个矩阵中的行列值。此处构成的矩阵在推荐系统中,难以集成到常见的算法中,也难与具体的物品之间建立关系。因此引入了相似度的概念,即计算用户和物品属性之间的相似度。其具体的思路如下:

考虑该用户进行过浏览或评分的所有物品,讲这些物品在每一项属性上获得的打分分别进行加权平均,得到一个综合的属性,作为该用户的模型。这种用户模型的有点是容易计算与物品之间的相似度,同时比较准确地描述了该用户在物品上的偏好。

上文提到的评价,是联系用户与一个物品的纽带,最简单也是最常见的评价就是打分。目前大多数的推荐算法都基于用户评分矩阵

用户评分矩阵即所谓的用户、物品以及评分所构成的二维矩阵。


2.推荐系统的输出

对一个特定的用户,推荐系统特定输出一般是一个个性化的推荐列表。通常按照优先级来依次列出用户可能感兴趣的物品。


3.个性化推荐的形式化

常规的推荐系统的基础往往都是用户评分矩阵,评分标准为1-5,而这种矩阵通常是非常稀疏的。因为用户往往会忽略评分这一过程,从而导致矩阵中的0值十分普遍,评分矩阵的稀疏度可能达到99%。

因此,在这种情况下我们所面临的问题则是:对于某一个用户,向他推荐哪些他没有打过分的物品是最容易被他接受的,这里的“接受”应根据具体的应用环境有所不同。


4.推荐系统的三大核心问题

通常来讲,推荐的核心问题有如下三种:预测推荐解释

预测
解决的主要问题是推断每一个用户对每一个物品的喜好程度,长期以来,做出这种推断的主要依据来源于用户评分矩阵中已有的信息,结合物品之间的相似度来计算用户在没有评分项目上的喜好程度。

推荐
解决的主要问题是根据预测环节所计算出的结果向用户推荐他没有他过分的物品。通常根据评分矩阵以及物品相似度计算,得到的预测物品结果的数量是很大的,用户不可能全部浏览一次,因此推荐的关键步骤在于对通过预测得到的物品列表进行优先级排序。通常而言,直接按照预测的评分值来排列进行物品推荐的先后顺序,但在实际的系统中,排序往往还需要结合更复杂的因素,例如用户的年龄段、近期的购买记录等,也就是用户画像

解释
该模块对推荐模块中所给出的推荐列表中的每一个物品或整体列表做出解释,从而说服用户理解系统为何要向他推荐他没有评分过的这些物品。

目前,预测仍然是研究的重点方向,近年来提出了基于内容的、基于协同过滤的方法。

原创粉丝点击