推荐系统综述——只谈感受不谈理论

来源:互联网 发布:如何求最大公约数 算法 编辑:程序博客网 时间:2024/05/01 14:34

推荐系统的概念

推荐系统是一类能够向用户推荐定制化信息的系统的统称。推荐系统的核心是“个性化”,所谓个性化就是指向用户提供为其“量身定做”的信息。当然,信息本身是客观存在的,推荐系统要做的只是将合适的信息适时地推送给特定用户。推荐系统的背景是“大数据”,目前几乎所有的推荐系统处理的都是海量的“大数据”,大数据一方面提供给推荐系统足够多的信息作为推荐依据,一方面也向推荐系统提出了计算能力上的挑战。推荐系统的本质是“预测”,也就是说,推荐系统本质上还是根据用户历史数据预测用户未来的行为。

 

推荐系统的意义

推荐系统是人工智能科学在现代社会的一类应用,是信息文明发展到一定程度的自然产物。

一方面,信息文明发展到今天,呈现出“信息大爆炸”的局面,在茫茫的信息海洋中,任何信息都只是沧海一粟,尽管它也许对于这个星球上的某些人而言具有特别的意义。但是在海量信息面前,人们愁的不再是信息匮乏,而是信息太多,缺乏提取“有用”信息的手段。事实上,在互联网世界里存在着大量“暗信息”,这些信息如果不经某种手段予以挖掘,很可能无人问津,尽管它们也许对某些人而言特别重要。

上世纪末涌现出的搜索引擎技术是相当成功的,因为它在一定程度上缓解了上面提到的问题。但是它做得还远远不够。首先,它不够智能。搜索引擎技术总是需要用户提供关键字以进行被动搜索,永远无法主动挖掘用户的需求并提供信息服务。其次,也是更要命的,它完全没有个性化。任何用户只要提供的关键字一致,那么搜索结果必然也一致,不管搜索发生在何时何地何种情景下。而智能化和个性化,恰恰是推荐技术较搜索引擎技术高明的地方。所以说,推荐系统是人们在解决“信息大爆炸”问题上迈出的最新的一步,它左右着信息时代人与信息之间的关系。

另一方面,人工智能科学发展到今天,赶上了大数据的浪潮。大数据带来的统计学意义使得以统计学习方法为主导思想的机器学习和数据挖掘技术如鱼得水。推荐系统正是在这种背景下诞生出的一个充满活力的细分领域,它直接享用了所有这些技术储备。而到目前为止推荐系统的成功,也给人们带来了希望,人工智能的春天还会远吗?

 

推荐系统的困境

不管怎么说,推荐系统仍是一个很年轻的领域,真正意义上的理论研究始于上世纪九十年代初,而真正成功的商用推荐系统可能也只是本世纪初的产物。推荐系统依然面临诸多困境。

3.1 冷启动问题

任何系统都会有个初始状态,如何开始特别重要。这里的“冷启动问题”是指推荐系统在初始状态时由于数据量稀疏,可能难以有效提供个性化推荐服务。打个比方,一个刚认识的朋友,由于对他缺乏足够了解,你将很难为他推荐一部电影或一本书,而我们对一个人的了解一般而言正是基于对这个人历史行为的观察。推荐系统也是如此,由于对一个新加入系统的用户缺乏足够观察,它将很难向该用户提供令人满意的个性化推荐服务。

3.2 准确性-多样性问题

衡量一个推荐是否成功,我们会比较关心它推荐的准确率,比如十次推荐有几次是用户真正接受的。但是如果有人总是向你推荐那些你显然会喜欢的东西,比如最最热门的音乐,那么这个推荐存在的必要性将大打折扣,因为即便没有这个推荐,你同样能轻松获得相关信息。作为一个享受推荐服务的人,你更需要的可能是那些比较准确,同时又能推荐一些不那么流行、有点小众、不借助特殊渠道可能无法及时获得相关信息的推荐,比如说一篇很符合你的口味却又不那么出名,你自己找估计还找不到的散文。一般而言,追求准确性,将丧失一部分多样性;反之,追求多样性,将牺牲一部分准确性。这之间的权衡,是推荐系统面临的大问题。

3.3 多维数据交叉利用

任何推荐系统在进行推荐时眼前都呈现出一张网,用户和物品以及它们间的行为关系构成了最基本的一个网络。而事实上,任何人绝不仅仅在一个网络中生存。简单来说,很多朋友可能都既是腾讯用户,也是新浪用户,同时还是百度用户。又如,很多朋友可能都分别在淘宝、京东、当当买过商品。如果一个推荐系统能整合多个网络中的数据,那么它对用户历史行为的观察将更加深刻,相应的,它的推荐能力将大大增强。同时,这也将有效缓解前述的冷启动问题。而如何实现跨平台推荐,还有待深入研究。

 

推荐系统展望

尽管目前的推荐系统大多研究最简单的用户-物品关系网络,本质是预测用户将来是否会与某一物品发生行为关系。但是泛化来看,预测用户行为是一件很了不起的事,它将使人类历史上第一次获得一种预测人类自身未来行为的有效机制,这项技术势必将渗透入人类社会生活的方方面面,而不仅仅是目前所见的互联网世界,尽管这已经是一个相当庞大的时空。另一方面,在推荐系统研究和应用过程中诞生出的种种思想和技术也将被提取并保留下来,在人工智能的其他领域继续发光发热。

0 0
原创粉丝点击