无处不在的推荐系统

来源:互联网 发布:蜂窝数据开关 编辑:程序博客网 时间:2024/04/29 12:16

这篇博客由微软主要研究者Thore Graepel执笔并发表。

博客正文

好的推荐任何地方都用得着。无论是找一部你可能喜欢的电影,或者一本你可能感兴趣的书籍,甚至是寻求facebook或linkedin上志同道合的朋友,自动推荐系统将会是个得力助手。刚开始自动推荐系统只限于网络用户,如今,随着微软Azure机器学习的不断普及,越来越多的人可以享受到自动推荐系统的优质服务,小到个人大到企业,为其客户带来便利。

自推系统如何是如何运作的?

一般而言,推荐系统是个二元体系,一个是”用户”,另一个是”商品”。用户指推荐物品的对象人群,”商品”指你想要推荐的物品,可以是电影,书籍,网页,菜谱,甚至是网友。

举个例子,假如我想给一个指定用户推荐饭店,参考该用户以及其他用户对其中一些饭店的历史评价(五星评价标准)。我们的推荐任务可以分两步走:

  • 预测该用户会如何评价每个饭店(五星评价标准)。
  • 从一份合格饭店清单中选出该用户可能会给出最高评分的饭店。

但是如果某个用户没有评价过这些饭店,那我们如何预测该用户的评价走向呢?机器学习发挥作用的时候到了。

如何预测评价?

针对”用户–商品”这种模式,我们需要收集各种形式的数据(用户ID,商品ID,评价等)来建立一个机器学习预测性模型,预测用户的评价走向。

你可以把它想成一个大型矩阵,用户为行,商品为列,而评分就是元素。大数据

这是个稀疏矩阵(大量条目缺失),因为普通用户只会给一小部分商品评分。Azure中贝叶斯推荐系统小工具(Bayesian RS implemented接收这些训练数据,设计相应的模型,预测该用户的评价结果,应用于“用户–商品”模式。评价标准不限于五星评级,只要不要涉及到隐私,比如购买次数,点击量或购买所花时间等判断标准也同样可行。

以上是如何做到的呢?

RS将用户和商品嵌入我们称之为潜在特质空间的地方(见下图)。如果用户(蓝点)和商品(红点)向量方向一致,那么该用户对该商品评价很高。反之则评价一般。特质空间里,相关用户和相似商品会放到一起,使”指定用户——商品”模式下预测用户评价成为可能,而训练数据库里是不提供评价的。

下图是一个二维特质空间,用来作阐述说明,而我们系统中使用20-100个维度的特质空间来分析。有时我们可以发现一些可以解释的特质,举个例子。南北走向的特质可能指“成人”和“小孩”,而东西走向的特质可能为“主流”和“小众”。大数据

面对新用户和新商品如何作出预测?

RS的唯一问题在于它属于慢热型产品。新用户作评价的次数不多,新商品收到的评价数也寥寥无几,因此很难作出预测。为了改善这一问题,Azure不仅使用ID来表示用户和商品,还使用了一种由元数据构成的特质向量。代表用户的特质向量包含所有个人信息,比如年龄,所在地等;代表电影的特质向量包括电影题材,演员,导演,上映日期等。最后,系统会利用元数据中的共同特质整合出相关用户和相似商品。

了解更多

如果你对自动推荐系统很好奇,可以看看Matchbox的论文: Large Scale Bayesian Recommendations.

如果你想建立自己的推荐系统传送通道,等Azure机器学习正式发布后,可以自己动手尝试一下。

下图所示的Azure机器学习工作室,备有一个推荐系统模板和功能强大的浏览器支持的用户界面,还有”拖动”功能,让整个过程变得相对简单。大数据

事实上,Azure机器学习预测用户评价结果包括两大模式——内容筛选和协作筛选。最后通过普及该应用,我们希望会有更多的人使用自动推荐系统,并在各种场合中发挥作用。

来自:http://www.36dsj.com/archives/28944

0 0
原创粉丝点击