《推荐系统实践》学习笔记(一)

来源:互联网 发布:java程序设计实训学校 编辑:程序博客网 时间:2024/05/17 20:28
第一章 好的推荐系统
1.信息过载:分类目录--搜索引擎--推荐系统
2.长尾理论:80/20原则
3.社会化推荐(social recommendation)好友给自己推荐物品
   基于内容的推荐(content-based filtering)和以前物品相似的物品
   基于协同过滤的推荐(collabrative filtering)和自己历史兴趣相似的用户的物品
4.依赖用户的行为数据。从实现的角度讲,就是挖掘用户的行为,找到用户个性化的需求。系统一般分为:前台的展示页面,后台的日志系统,以及推荐算法系统。
5.个性化的成功推荐需要两个条件,1. 信息过载 2,用户的需求不够明确。
7.什么样的物品适合推荐:消费代价小,用户热情高,种类丰富,重用率高,反馈容易。
8.个性化推荐系统的应用
  • Amazon
             个性化推荐列表1:基于物品的推荐算法(item-based method):推荐和之前喜欢的物品相似的
             个性化推荐列表2:基于好友的推荐:根据Facebook好友关系,推荐好友喜欢的物品
             相关推荐列表1:购买了也买了    打包销售(cross selling)
             相关推荐列表2:浏览了购买了
  • Netflix,YouTube,Hulu
              基于物品的推荐算法
  • Pandora:专家标注(音乐的基因)相似度
              Last.fm :利用用户行为计算相似度
  • Facebook
              宝贵的数据;用户之间的社交网络关系,用户的偏好信息
              API(Instant Personalization)推荐好友最喜欢的物品
              EdgeRank:推荐其他用户在社交网站的会话
              给用户推荐好友
  • Google Reader:感兴趣的人的分享
              Zite:用户的偏好信息
  • 个性化广告--物品就是广告,帮助广告找到可能感兴趣的用户
9.推荐系统的指标:预测准确度,同时扩展用户的视野。准确度,覆盖度,新颖性,惊喜度,信任度,透明度。
10.实验方法:离线实验,用户调查,在线实验(AB测试)。
11.评测指标:
      用户满意度(显式的用户反馈),
      预测准确度(评分预测(均方根误差RMSE,平均绝对误差MAE),
      topN推荐(准确率和召回率,会看曲线和趋势),
      覆盖率(覆盖长尾的能力,通过物品在推荐列表出现的次数的分布来描述长尾能力:信息熵和基尼指数),
      多样性(用推荐物品的相似性差异性来评价多样性),
      新颖性,(用户没听说)
      惊喜度(推荐了和历史不相似但用户满意的物品),
      信任度(增加透明度,给出解释,建立用户之间的信任系统), 
      实时性,
      强健性(行为注入攻击), 
     商业目标,),
0 0
原创粉丝点击