推荐系统的常用算法

来源:互联网 发布:淘宝usa商城假货 编辑:程序博客网 时间:2024/06/05 20:14

推荐系统的任务就是,联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对他感兴趣的人群中,从而实现信息提供商与用户的双赢。


1 基于人口统计学的推荐
根据系统用户的基本信息发现用户的相关程度,然后将相似用户喜爱的其他物品推荐给当前用户。


2 基于内容的推荐
与上面的方法相类似,只不过这次的中心转到了物品本身。使用物品本身的相似度而不是用户的相似度。


3 协同过滤 (Collaborative Filtering, 简称 CF)

三个步骤:

收集数据——找到相似用户和物品——进行推荐

收集数据

这里的数据指的都是用户的历史行为数据,比如用户的购买历史,关注,收藏行为,或者发表了某些评论,给某个物品打了多少分等等,这些都可以用来作为数据供推荐算法使用,服务于推荐算法。

找到相似用户和物品

计算用户间以及物品间的相似度。

进行推荐
在协同过滤中,有两种主流方法:基于用户的协同过滤,和基于物品的协同过滤。
基于用户的 CF :
下图给出了一个例子,对于用户 A,根据用户的历史偏好,这里只计算得到一个邻居 - 用户 C,然后将用户 C 喜欢的物品 D 推荐给用户 A。


基于物品的 CF :
下图给出了一个例子,对于物品 A,根据所有用户的历史偏好,喜欢物品 A 的用户都喜欢物品 C,得出物品 A 和物品 C 比较相似,而用户 C 喜欢物品 A,那么可以推断出用户 C 可能也喜欢物品 C。


区别:
基于用户的协同过滤——基于人口统计学的推荐
它们所不同的是如何计算用户的相似度,基于人口统计学的机制只考虑用户本身的特征,而基于用户的协同过滤机制可是在用户的历史偏好的数据上计算用户的相似度。

基于物品的协同过滤——基于内容的推荐
相似度计算的方法不一样,前者是从用户历史的偏好推断,而后者是基于物品本身的属性特征信息。

原创粉丝点击