推荐系统

来源:互联网 发布:人工智能试题及答案 编辑:程序博客网 时间:2024/06/05 01:55

推荐系统的基本任务是联系用户与物品,核心是面对信息过载问题

(1)推荐系统能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容 
(2)推荐系统可以更好地发掘物品的长尾

推荐算法的本质是通过一定的方式将用户与物品联系起来,大致有三种方式: 
(1)社会化推荐 
(2)基于内容的推荐 
(3)基于协同过滤的推荐

评测指标

1用户满意度

2预测准确度

(3)评分评测系统 —— RMSE 或 MAE 

这里写图片描述 
这里写图片描述 
(4)TopN推荐系统 —— 准确率 或 召回率 
这里写图片描述 
这里写图片描述 


3覆盖率

(1)覆盖率描述一个推荐系统对物品长尾的发掘能力。
(2)可以通过研究物品在推荐列表中出现次数的分布描述推荐系统发掘长尾的能力,可以用信息熵和基尼系数两个指标衡量 
这里写图片描述 
这里写图片描述 
其中,p(i)是物品i的流行度比上所有物品的流行度之和(关于流行度的计算公式尚未出现);i_j是按照物品流行度p()由小到大排序后的物流表中的第j个物品 


4 多样性

(1)多样性描述了推荐列表中物品两两之间的不相似性,主要靠问卷调查获取 
(2)推荐系统的整体多样性可以定义为所有用户推荐列表多样性的平均值,即 
这里写图片描述 
,其中用户u在推荐列表R(u)下的多样性为 
这里写图片描述 
其中,s(i,j)定义了物品i与j之间的相似度。


5 新颖性 

最简单的实现方式,即吧那些用户之前在网站中对其有过行为的物品从推荐列表中过滤掉 

如果推荐结果中物品的平均热门程度较低,则推荐结果可具有较高的新颖性。


6 惊喜性

注意与新颖性进行区别,尚没有公认的定义指标,只能通过问卷调查获取


7 信任性

提高推荐系统的信任度主要在于需要增加推荐系统的透明度,即提供对推荐系统的解释,让用户明白其运行机制 
考虑用户的社交网络信息,利用好友信息进行推荐,利用好友进行解释等


8 实时性

(1)推荐系统需要实时地更新推荐列表来满足用户新的行为变化 —— 通过推荐列表的变化速率来评测 
(2)推荐系统需要能够将新加入系统的物品推荐给用户 —— 利用用户推荐列表中多大比例的物品是当天新加入的来评测


9 健壮性

(1)健壮性衡量一个推荐系统抗击作弊(人为攻击)的能力 
(2)评测主要利用模拟攻击 
(3)可以通过以下手段提高系统健壮性: 
设计推荐系统时尽量使用代价比较高的用户行为,例如将浏览行为换为购买行为 
在使用数据前,进行攻击测试,从而对数据进行清理


10 商业目标

与网站的盈利模式相关

评测算法的性能: 

用户维度:主要包括用户的人口统计信息、活跃度以及是不是新用户等 
物品维度:包括物品的属性信息、流行度、平均分以及时不时新加入的物品等 
时间维度:包括季节、是工作日还是周末,是白天还是晚上等

原创粉丝点击