推荐系统

来源:互联网 发布:u盘引导盘制作工具mac 编辑:程序博客网 时间:2024/05/17 04:32

推荐系统

  • 基于内容的推荐
  • 基于item的协同过滤

基于内容的推荐

基于内容相似度的推荐就是根据喜欢的内容(例如:新闻推荐中已经阅读过的内容),推荐与其内容相似的内容给用户。
这时可以分为两种情况:已经产生了历史数据的老用户,以及没有使用过的新用户。
同时需要厘清两个关键点:如何获取用户喜欢的内容(对于用户喜好的评判标准及喜好的获取),以及如何评判推荐内容与用户历史数据内容之间的相似性。
一一来看:
如何获取用户喜好:可以通过用户浏览记录获取用户浏览新闻内容,根据浏览新闻的关键词,统计关键词出现的频率,获取用户喜好。
如何度量相似度:根据获取用户喜好方法可知,我们通过关键词来度量用户喜好,那么相似度的度量一定是对用户喜好进行某种相似度层面的量化,最直观的方式就是把历史数据的关键词与待推荐的新闻的关键词进行一一比较,但是由于关键词完全吻合的难度较大,不完全吻合的新闻之间的主题内容也有可能是一致的,因此需要一种更恰当的评价方式,常用的方法有TF-IDF。

TF-IDF(term frequency–inverse document frequency)介绍:TF,即词频,指某个词在给定文章中出现的次数,为防止受到文章长短的影响,该值一般使用归一化后的值。 IDF,即逆向文件频率