推荐系统面临的问题

来源:互联网 发布:楚河汉街美食攻略 知乎 编辑:程序博客网 时间:2024/06/06 08:33

推荐算法的鲁棒性

由于推荐系统能够影响用户的购买行为,带来经济效益,因此越来越多的恶意用户设法通过影响推荐系统的行为来控制推荐系统以实现提高物品销量,损坏竞争对手利益,甚至破坏系统使其无法产生有效推荐[1]。通常所说的对推荐系统的攻击指的是针对协同过滤方法的攻击,因为其他比方法是基于客观事物的信息,用户通常无法操纵这些信息的修改。文献[2]分析了4大类8种不同的攻击策略。文献[56]从不同的维度考虑了攻击策略的分类:从攻击者需要的知识,将攻击粗略地分为高知识攻击和低知识攻击;从攻击者的目的分为推举攻击和打压攻击。其中推举攻击通常又包括随机攻击、均值攻击、造势攻击和局部攻击;打压攻击包括爱/憎攻击和反向造势攻击。关于每种攻击的详细介绍可以参考文献[1].

针对这些攻击,通常有两种应对方式,也是推荐系统脆弱性方面有意义的两个研究难题。一种是攻击检测——发现系统中的攻击,然后消除或降低这些攻击对推荐的影响[3]。另外一种是设计更加健壮的算法[4]。到目前为止,对于推荐系统的鲁棒性的研究还比较少,缺少系统性的分析,而攻击策略却层出不穷。

冷启动问题

冷启动指的是刚进入一个系统的新用户没有关于他相关的历史记录,系统无法给其提供精确的推荐(用户冷启动),或者新产品没有关于其被评价或购买的相关信息,无法将其推荐给合适的用户(物品冷启动)。协同过滤方法面临用户冷启动和物品冷启动两方面的问题,基于内容的推荐方法面临物品冷启动问题。总得来说,冷启动问题获得了比较多的关注,最直接的方法是通过调查询问用户相关信息来获取其偏好.解决冷启动问题的其他方法还包括混合方法[5]、基于标签的方法、基于社区的方法、基于关联规则或聚类的方法等等。混合推荐方法,多维数据交叉利用以及社会推荐是研究解决冷启动问题有意义的三个方向。

3 推荐系统中用户隐私问题

用户隐私保护是互联网中长期存在的问题,推荐系统由于需要利用用户的历史行为信息、甚至用户的人口统计属性信息而面临严峻的隐私保护问题。一个不能很好保护用户隐私的系统会让用户缺少安全感,不愿提供更多个人信息,造成无法提供有效推荐。用户的隐私泄露给恶意用户会形成针对系统的攻击。Web2.0技术的发展,用户在互联网的不同地方留下了很多“痕迹”。组合来自不同源的用户信息可以推断出用户更多不愿透露的隐私[6]。移动互联网时代带来的移动终端的广泛普及使得用户的隐私保护显得更加迫切和重要。针对这方面的研究目前主要有混合方法[7]、模糊处理方法[8]以及分布式协同过滤方法[9]等。

移动信息系统上的推荐

移动信息系统具有三个主要特点:用户可移动性、设备可携带性和无线网络连通性。此外,移动设备屏幕尺寸以及其设备的计算和存储能力上的限制使得传统的推荐算法可能无法直接复制到移动信息系统中。在移动信息系统中执行推荐,时间,位置,天气,用户心情等都要考虑。各种设备的可接入也使得隐私保护问题相对于传统推荐系统更加严峻。高度可扩展性、方便用户以及低延时是移动环境下执行推荐的关键需求.其他的研究问题还包括用户的位置隐藏及位置上下文感知。

5 大数据处理与算法可扩展性问题

关于推荐系统的实验研究已经进入了较成熟的阶段,如何将这些推荐技术应用到实际运行的系统中成为关键问题。通常在小规模数据集上的离线测试表现良好的推荐技术在实际的大规模数据集上实施时并不奏效。与此同时,实际系统不仅数据量大,而且新用户新产品会不断进入系统,用户和产品之间会不停的产生新的连接(收藏、评论、购买等等)使得系统中的数据处于动态变化中。大数据处理和算法的可扩展性成为推荐技术实施迫切需要解决的问题。

推荐的多样性和新颖性

推荐的多样性和新颖性作为评价推荐效果好坏的重要维度已经受到越来越多的关注。尽管在这方面已经有一些研究,但仍然面临着许多的挑战急需解决首先,很多提出的提高推荐多样性的方法,虽然在应用上有效,但是缺乏理论基础,比如通过对初始生成的推荐列表重排列[12],或者通过参数结合不同方法得到新的推荐列表[13],这些都不是在设计推荐算法的时候就考虑了多样性,只能算是一种对推荐列表改进的粗糙方法。其次,虽然认识到了推荐准确性和多样性之间是矛盾的,但对于推荐的准确性和多样性之间更复杂的关系缺乏深入的分析;最后,推荐的解释性对于用户的体验非常重要,且用户对多样性的感知能力是有限的。大多数提出的提高多样性的算法缺乏解释性不利于用户接受。

跨领域推荐系统

跨领域推荐指的是整合来自不同系统的数据实行推荐。实际生活中每个人都会进入很多的系统,并在不同的系统中留下信息。可以利用一个系统中的行为记录来预测另一系统中用户预期行为[10]或者整合不同系统的信息提供推荐。在大数据时代背景下如何合理整合来自不同系统的数据实现个性化的推荐是一个热点,同时也是难点[11]

融合用户的长期兴趣和短期兴趣

用户的兴趣可以分为长期兴趣和短期兴趣。好的推荐技术不仅要考虑用户的长期兴趣,而且需要考虑用户的短期兴趣。这在新闻推荐和移动互联网下的推荐上尤其明显。比如一个对科技工作者一般会阅读科技方面的新闻,而当国际大事件比如奥运会开始的时候,他也会关注奥运方面的很多新闻。或者随场景不同,用户心情不同,用户的兴趣也会有差异。如何在保证不伤害用户长期兴趣的前提下充分满足用户的短期兴趣是研究的难点。

社会推荐

社会关系对于产品销售的影响很早就被人们认识到。一些研究认为,在推荐系统中,社会关系的影响甚至比历史行为信息的相似性更加重要]。在推荐系统中整合社会网络方面的数据因为增加了用户和用户之间额外的信息能够提高推荐的准确性,甚至不再一定需要基于评分计算用户之间的相似性,可以解决数据稀疏性问题和冷启动问题。随着web2.0技术的普及,越来越多的在线社交网络出现使得研究社会关系在推荐系统中能起的作用变成了热点。从第三届ACM 推荐系统会议开始,基于社会网络的推荐成为了每届ACM推荐系统会议的征稿主题之一。基于社会网络的推荐尽管是研究的趋势,但同样面临很多的挑战。


关于推荐的挑战,读者还可以移步:http://blog.sciencenet.cn/home.php?mod=space&uid=3075&do=blog&id=554630(个性化推荐的十大挑战)。大牛周涛的总结。我整理的上面九个挑战也一定程度上参考了这篇文章,算是抛砖引玉吧。

【参考文献】

 

[1] Mobasher B, Burke R, Bhaumik R, et al. Toward trustworthy recommender systems: An analysis of attack models and algorithm robustness. ACM Transactions on Internet Technology (TOIT), 2007, 7(4): 23..

[2] Burke R, O’Mahony, Hurley J. Robust collaborative recommendation.Recomm-

     ender Systems Handbook. Springer US, 2011: 805-835..

[3] Williams C A, Mobasher B, Burke R. Defending recommender systems: detection of profile injection attacks. Service Oriented Computing and Applications, 2007, 1(3): 157-170.

[4] Mehta B, Hofmann T. A Survey of Attack-Resistant Collaborative Filtering Algorithms. IEEE Data Eng. Bull, 2008, 31(2): 14-22.

[5] Li Z, Tao Q, Piqiang T. Using Key Users of Social Networks to Solve Cold Start Problem in Collaborative Recommendation Systems. Information Technology Journal, 2013, 12(22): 7004-7008.

[6] Ramakrishnan N, Keller B J, Mirza B J, et al. Privacy risks in recommender systems. IEEE Internet Computing, 2001, 5(6): 54-63.

[7] Aïmeur E, Brassard G, Fernandez J M, et al. Alambic: a privacy-preserving recommender system for electronic commerce. International Journal of Information Security, 2008, 7(5): 307-334.

[8] Polat H, Du W. SVD-based collaborative filtering with privacy. In: Proceedings of the 2005 ACM symposium on Applied computing. Santa Fe: ACM, 2005: 791-795..

[9] Shyong K, Frankowski D, Riedl J. Do you trust your recommendations? An exploration of security and privacy issues in recommender systems. Emerging Trends in Information and Communication Security. Berlin: Springer Berlin Heidelberg, 2006: 14-29.

[10] N. Nori, D. Bollegala, M. Ishizuka. Exploiting user interest on social media for aggregating diverse data and predicting interest.Artificial Intelligence,2011 109(B3) :241-248.

[11] Shaghayegh Sahebi and Peter Brusilovsky. Cross-Domain Collaborative Recommendation in a Cold-Start Context: The Impact of User Profile Size on the Quality of Recommendation. In: 21st International Conference on User Modeling, Adaptation, and Personalization.Rome: Springer, 2013, 289–295.

[12] Adomavicius, G., & Kwon, Y. Improving aggregate recommendation diversity using ranking-based techniques.IEEE transactions on knowledge and data engineering.2011,24(5):1-15.

[13] Hijikata Y, Shimizu T, Nishida S. Discovery-oriented collaborative filtering for improving user satisfaction. In: Proceedings of the 14th international conference on Intelligent user interfaces. Florida:ACM,2009,67-76.

1 0