《推荐系统实践》读书笔记——第五章

来源:互联网 发布:优化神马pc关键词排名 编辑:程序博客网 时间:2024/05/20 00:12

1 利用上下文信息

用户访问推荐系统的上下文信息包括时间、地点、心情等。上下文信息中最重要的是时间上下文信息。时间信息对用户兴趣的影响表现在以下几个方面:

1)  用户的兴趣是变化的;

2)  物品也是有生命周期的;

3)  季节效应。

推荐系统每天推荐结果的变化程序被定义为推荐系统的时间多样性。提高推荐结果的时间多样性分为两步:首先,需要保证推荐系统能够在用户有了新的行为后及时调整推荐结果,使推荐结果满足用户最近的兴趣;其次,需要保证推荐系统在用户没有新行为的时候也能够经常变化一下结果,具有一定的时间多样性。

当然,时间多样性也不是绝对的,推荐系统需要首先保证推荐的精度,在此基础上适当地考虑时间多样性。

1.1  时间上下文推荐算法

用户在相隔很短的时间内喜欢的物品具有更高的相似度,用户近期行为相比很久以前的行为,更能体现用户的现在的兴趣。

时间上下文相关的的ItemCF算法:ItemCF的思想是先利用用户的行为计算物品之间的相似度,然后给用户推荐与用户历史记录相类似的物品。时间下下文相关的ItemCF算法是在传统的ItemCF考虑时间效用,在计算物品相似的时候考虑时间信息,可以通过以下公式进行计算两种物品之间的相似度:


其中,f为衰减函数,f函数的含义是,用户对物品i和物品j产生行为的时间越远,则f越小。


Tui是用户u对物品i产生行为的时间。

预测公式也引入时间信息,预测公式修正如下:


其中,t0为当前时间。

         与时间上下文相关的ItemCF算法类似的还有时间上下文相关的UserCF算法,不管是在计算相似度的时候,还是在预测的时候,都与之类似,引入时间信息。

1.2  地点上下文信息

除了时间,地点也是一种重要的上下文信息,不同地区的用户兴趣可能会有所不同,用户到了不同的地方,兴趣也会有所不同。

明尼苏大大学的研究人员提出过一个称为LARS(locationaware recommender system,位置感知推荐系统)的和用户地点相关的推荐系统,发现了用户兴趣和地点相关的特征,对于数据集形如(用户,用户位置,物品,评分),LARS的基本思想是将数据集根据用户的位置划分成很多子集,因为位置信息是一个树状结构,然后,给定每一个用户的位置,我们可以将他分配到某一个叶子节点,而该叶子节点包含了所有和一个位置的用户的行为数据集。然后,LARS就利用这个叶子节点上的用户行为数据,通过ItemCF给用户进行推荐。

0 0