推荐系统经典论文文献及业界应用
来源:互联网 发布:行知小学 编辑:程序博客网 时间:2024/05/23 11:44
Survey方面的文章及资料
- Adomavicius G,Tuzhilin A.
Toward the next generation ofrecommender systems: A survey of the state-of-the-art and possibleextensions[J]. Knowledge and Data Engineering, IEEETransactions on, 2005, 17(6):734-749. 2005年的state-of-the-art的推荐综述,按照content-based,CF, Hybrid的分类方法进行组织,并介绍了推荐引擎设计时需要关注的特性指标,内容非常全。 - MarlinB.
Collaborative filtering: A machinelearning perspective[D]. University of Toronto, 2004.从传统机器学习的分类角度来介绍推荐算法,有一定机器学习背景的人来看该文章的话, 会觉得写得通俗易懂 - Koren Y, BellR.
Advances in collaborativefiltering[M]//Recommender Systems Handbook . Springer US,2011: 145-186.RSsHandbook中专门讲述协同过滤的一章,其中对近年协同过滤的一些重要突破进行了介绍,包括因式分解,时间相关推荐,基于近邻的推荐以及多种方法的融合,内部不多,但其中引用的论文值得细看 - Su X, KhoshgoftaarT M.
A survey of collaborative filteringtechniques[J]. Advances in artificial intelligence, 2009,2009: 4. 协同过滤的篇survey, 按照memory-base, model-based,hybrid分类方法介绍各种协同过滤方法及评价标准,并在其中给出基于netflix数据进行评估的效果对比 - Koren Y, Bell R,Volinsky C.
Matrix factorizationtechniques for recommender systems[J]. Computer, 2009,42(8): 30-37. 主要集中在因式分解实现协同过滤方法,如果看完Advances incollaborative filtering[M]//Recommender SystemsHandbook的话,这篇文章就没有必要再看了 - Pazzani M J,Billsus D.
Content-based recommendationsystems [M]//The adaptive web. Springer Berlin Heidelberg,2007: 325-341.从宏观上介绍content-based的策略架构 - Burke R. Hybridrecommender systems: Survey and experiments[J]. User modeling anduser-adapted interaction, 2002, 12(4): 331-370.
Content-based方法
content-based方法非常依赖于特定领域item的特征提取及处理,例如音乐推荐或是关键词推荐中很多细节内容信息处理过程都是不一样的,故这里仅列了content-based综述类的几篇文章。
- Pazzani M J,Billsus D.
Content-based recommendationsystems [M]//The adaptive web. Springer Berlin Heidelberg,2007: 325-341.从宏观上介绍content-based的策略架构 - Lops P, de GemmisM, Semeraro G.
Content-based recommendersystems: State of the art and trends[M]//RecommenderSystems Handbook. Springer US, 2011: 73-105. RSHandbook中专门介绍content-based 算法的章节 - Jannach D, ZankerM, Felfernig A, et al.
Content-basedrecommendation [M] Charpter 3 Recommender systems: anintroduction[M]. Cambridge University Press, 2010.
Collaborative Filtering方法
Neighbourhood Based Methods
- Sarwar B, KarypisG, Konstan J, et al.
Item-basedcollaborative filtering recommendationalgorithms [C]//Proceedings of the 10th internationalconference on World Wide Web. ACM, 2001: 285-295.KNN进行item-based推荐的经典文章,其中也介绍了多种相似度度量标准 - Linden G, Smith B,York J.
Amazon. com recommendations:Item-to-item collaborative filtering [J]. InternetComputing, IEEE, 2003, 7(1): 76-80. 经典的亚马逊item-based算法的文章 - Gionis A, Indyk P,Motwani R.
Similarity search in highdimensions via hashing[C]//VLDB. 1999, 99: 518-529. LSH - Bell R M, KorenY.
Scalable collaborative filtering withjointly derived neighborhood interpolationweights[C]//Data Mining, 2007. ICDM 2007. Seventh IEEEInternational Conference on. IEEE, 2007: 43-52. - Indyk P, MotwaniR.
Approximate nearest neighbors: towardsremoving the curse of dimensionality[C]//Proceedings ofthe thirtieth annual ACM symposium on Theory of computing. ACM,1998: 604-613. LSH - BuhlerJ.
Efficient large-scale sequencecomparison by locality-sensitive hashing [J].Bioinformatics, 2001, 17(5): 419-428. LSH应用 - Chen T, Zheng Z, LuQ, et al.
Feature-basedmatrix factorization[J]. arXiv preprintarXiv:1109.2271, 2011.上交Apex实验室开发的svdfeature工具背后的原理。优点是可以对照着代码学习 - Zhuang Y, Chin W S,Juan Y C, et al. A fast parallel SGD for matrix factorization inshared memory systems[C]//Proceedings of the 7th ACM Conference onRecommender Systems. ACM, 2013: 249-256.
recsys2013 最佳论文,并行矩阵分解
Model Based Methods
-
Koren Y, Bell R, VolinskyC. Matrix factorization techniques forrecommender systems [J]. Computer, 2009, 42(8):30-37.主要集中在因式分解实现协同过滤方法,如果看完Advances in collaborativefiltering[M]//Recommender SystemsHandbook的话,这篇文章就没有必要再看了 - Singh A P, Gordon GJ.
A unified view of matrix factorizationmodels[M]//Machine Learning and Knowledge Discovery inDatabases. Springer Berlin Heidelberg, 2008: 358-373.
Hybrid Methods
- KorenY.
Factorization meets the neighborhood: amultifaceted collaborative filtering model[C]//Proceedingsof the 14th ACM SIGKDD international conference on Knowledgediscovery and data mining. ACM, 2008: 426-434.因式分解与Neighbour-based方法融合 - BurkeR.
Hybrid recommender systems: Survey andexperiments[J]. User modeling and user-adaptedinteraction, 2002, 12(4): 331-370. 介绍了多种推荐算法进行融合的框架 - Adomavicius G,Tuzhilin A. Context-aware recommender systems[M]//Recommendersystems handbook. Springer US, 2011: 217-253. context aware
RS介绍,可以对照RS Handbook中相关章节阅读
LBS推荐算法
- Zheng V W, Zheng Y,Xie X, et al.
Collaborative location andactivity recommendations with gps historydata[C]//Proceedings of the 19th international conferenceon World wide web. ACM, 2010: 1029-1038 介绍了对GPS数据根据时间,地域维度进行网格化聚类,根据网页评论构建location-activity矩阵(这个感觉不靠谱),根据搜索引擎构建activity-activity矩阵,根据poi信息构建location-feature矩阵,之后填充稀疏的location-activity矩阵达到推荐目的 - Husain W, Dih LY.
A framework of a personalizedlocation-based traveler recommendation system in mobileapplication[J]. International journal of multimedia andubiquitous engineering, 2012, 7(3): 11-18. 第一轮使用content-based进行初步过滤(相当于触发);第二轮使用CF进行细化推荐 - Leung K W T, Lee DL, Lee W C.
CLR: a collaborative locationrecommendation framework based onco-clustering[C]//Proceedings of the 34th internationalACM SIGIR conference on Research and development in InformationRetrieval. ACM, 2011: 305-314. 将LBS推荐过程中涉及的entity由user-location推广至user.activity. location三者的关系使用agolomative方法进行挖掘推荐 - Ye M, Yin P, Lee WC, et al. Exploiting geographical influence for collaborativepoint-of-interest recommendation[C]//Proceedings of the 34thinternational ACM SIGIR conference on Research and development inInformation Retrieval. ACM, 2011: 325-334.
- Zheng Y, Zhang L,Xie X, et al. Mining interesting locations and travel sequencesfrom GPS trajectories[C]//Proceedings of the 18th internationalconference on World wide web. ACM, 2009: 791-800.
推荐系统工业界应用
- Netflix:Netflix视频推荐的背后:算法知道你想看什么
- Netflix:NetflixRecommendations Beyond the 5 Stars:大名鼎鼎的Netflix推荐系统交互,算法,架构的介绍;非常详尽的PPT,太多干货,强烈推荐
- Netflix:Recommender SystemsMLSS’14 Collaborative and other Approaches,非常详细的推荐系统介绍,知识架构相对完整,并且与Netflix系统结合较为紧密即学术又实践
- Hulu:Recommender SystemAlgorithm and Architecture-项亮
- Hulu:
Personaliztion inHulu, Hulu的个性化实践。其中对Hulu推荐场景的分析非常细致,相当于先Debug数据,之后再做推荐,思路非常值得学习 - Youtube:Davidson J,Liebald B, Liu J, et al.
The YouTube videorecommendation system[C]//Proceedings of the fourth ACMconference on Recommender systems. ACM, 2010: 293-296. Youtube推荐系统中的主要算法。 百度关键词搜索推荐系统对其进行了优化,实现了任意类型的级联二部图推荐。 具体内容可参见博文: googleyoutube 电影推荐算法, 以及百度关键词搜索推荐级联二部图实现 - 豆瓣:
个性化推荐系统的几个问题_豆瓣网王守崑 - 豆瓣:阿稳_寻路推荐_豆瓣
- 豆瓣:豆瓣在推荐领域的实践与思考
- 百分点:量化美-时尚服饰搭配引擎
- weibo及考拉FM:停不下来的推荐实践_陈开江
- 阿里:天猫双11推荐技术应用
- 阿里:淘宝推荐系统
- 淘宝:一淘大规模推荐系统,一淘网Item-basedCF推荐系统介绍,其中很多淘宝行为数据比较有意思,值得参考;另外为了可扩展行,使用Item-basedCF在各种应用场景下一招走天下的思路, 也非常值得借鉴
- 淘宝:
搜索个性化:淘宝搜索引入个性化的技术, 包括架构和策略 - 淘宝:
电商推荐-袁泉 - 当当:当当网搜索和推荐_庄洪波
- 土豆:个性化视频推荐系统土豆_明洪涛
- 360:360推荐系统实践-杨浩
- 盛大:推荐系统实战与效果提升之道-陈运文
- 盛大:智能推荐系统的开发与应用-陈运文
-
University of Szeged,Hungary推荐系统演讲 - Google NewsPersonalization: Scalable Online Colleborative Filtering
- 世纪佳缘:婚恋交友中的用户推荐系统:其中将推荐问题按照效果漏斗进行分析的思路比较有意思
- 美丽说:
美丽说个性化推荐:重点介绍美丽说推荐排序方法,百度之前老大的分享 - 美团:
美团生活服务推荐:结合美团O2O业务的推荐系统 - 高德:推荐系统在业界及高德应用,部分内容涉密,进行了删减
- 百度:百度商业关键词搜索推荐,介绍了学术界推荐系统算法,并结合百度,Netflix,高德LBS对工业界推荐系统进行介绍,PPT非常完整,可以作为推荐系统知识体系及业界实现的教材
推荐系统书籍
- SegaranT.
Programming collective intelligence:building smart web 2.0 applications[M]. O’Reilly Media,2007.寓教于乐的一本入门教材,附有可以直接动手实践的toy级别代码 - ShapiraB.
Recommender systemshandbook[M]. Springer, 2011. 推荐系统可做枕头,也应该放在枕边的书籍,看了半本多。如果将该书及其中的参考文献都看完并理解,那恭喜你,你已经对这个领域有深入理解了 - Jannach D, ZankerM, Felfernig A, et al.
Recommendersystems: an introduction [M]. Cambridge University Press,2010.可以认为是2010年前推荐系统论文的综述集合 - CelmaO.
Music recommendation anddiscovery[M]. Springer, 2010.主要内容集中在音乐推荐,领域非常专注于音乐推荐,包括选取的特征,评测时如何考虑音乐因素 - Word sensedisambiguation: Algorithms and applications[M]. SpringerScience+ Business Media, 2006.
如果涉及到关键词推荐,或是文本推荐,则可以查阅该书
P.S.想对某个领域或是工具有深入了解,可以找一本该行业的XXHandBook满怀勇气与无畏细心看完,然后就会对这个领域有一定(较深)了解,当然如果手头有相关项目同步进行,治疗效果更好^_^
推荐系统工具
- Mahout:基于hadoop的机器学习,数据挖掘,推荐系统开源工具。我厂的超低版本haodop集群居然不支持Mahout,想跑个Mahout还要进行移植,郁闷。。。该死!!
- scikit-learn:基于python的机器学习,数据挖掘库,方便好用,适合数据量较小的调研任务,不过,一切不支持大数据的机器学习算法,(一定程度上)都是耍流氓。。。。
- weka:经典得不能再经典的数据挖掘工具,java版本
- R:R语言
- Cluto:聚类工具,集成了较多聚类算法及相似度度量方法;单机,数据量受限
- RapidMiner:没用过,但据说使用量非常大
- svdfeature:上交Apex开发的svd工具集,代码质量不错,而且附带(MovieLen数据集)示例,直接下载各MovieLens数据集就能实验效果
- LibFM:Rendle S.Factorization machines with libFM[J]. ACM Transactions onIntelligent Systems and Technology (TIST), 2012, 3(3): 57.实现了SGD,ALS等多种矩阵分解算法;作者使用该工具获过。其中ALS一般在大数据情况下使用(Mahout中使用该矩阵分解变种)
- GraphLib: 集成了协同过滤,Random Walk,Clustering, Topic Model等多种图关系挖掘算法
经典推荐算法大赛数据
- netflix大赛数据:netflix大赛数据,想尝试各种算法效果,可以用该数据做实验;netflix已经不再发布数据,如有需要可从该链接下载
- Movielen数据集
- RecSys Chanllenge2015: RecSys 2015 大赛,电商session 购买行为预测, 感兴趣的可以用该数据进行实验
国内外推荐系统站点
- http://xavier.amatriain.net/
XavierAmatriain的博客,作者是Netflix的研发经历,理论工程并重,非常接近实战。强烈推荐 http://technocalifornia.blogspot.com/ - http://www.csie.ntu.edu.tw/~cjlin/
林智仁的主页,主要是svm开源工具,同时提供LIBMF应用于推荐 - http://www.resyschina.com/
- http://www.recommenderbook.net/teaching-material
各种推荐系统的教学资料
因为我一直认为推荐系统不是一个独立的学科,它很多技术都是直接来自于机器学习,数据挖掘和信息检索(特别是文本相关的搜索推荐),所以以下也整理了一些之前工作及工作之余看过,了解过,或者准备看的这方面的资料
数据挖掘资料
- Han J, Kamber M,Pei J.
Data mining: concepts andtechniques[M]. Morgan kaufmann, 2006.数据挖掘方面的handbook,教科书类型,虽然厚,却通俗易懂(再次提醒,要了解某一领域,找本该领域的啥啥handbook耐心认真读完,那你基本对该领域有一定认识了) - ChakrabartiS.
Mining the Web: Discovering knowledgefrom hypertext data[M]. Morgan Kaufmann,2003.介绍了一个搜索引擎中的大部分技术,包括spider,索引建立,内部的机器学习算法,信息检索,而且非常具有实用性,我在百度商务搜索部开发的spider,就是按照其中的架构设计开发的 - LiuB.
Web data mining: exploring hyperlinks,contents, and usage data [M]. Springer, 2007.如果说Mining the Web: Discovering knowledgefrom hypertext data更偏webmining更偏整体,工程的话,这本书就更偏策略,两本都读过的话,你对搜索引擎中的数据挖掘算法的了解,就比较全面了 - Wu X, Kumar V,Quinlan J R, et al.
Top 10 algorithms indata mining [J]. Knowledge and Information Systems, 2008,14(1): 1-37. 专门将2006年评选出来的10大数据挖掘算法拎了出来讲讲 - Rajaraman A, UllmanJ D.
Mining of massivedatasets[M]. Cambridge University Press,2012.介绍如何使用hadoop进行数据挖掘,如果有hadoop环境则非常实用 - Feldman R, SangerJ.
The text mining handbook: advancedapproaches in analyzing unstructured data[M]. CambridgeUniversity Press, 2007.文本挖掘的handbook - Witten I H, FrankE.
DataMining: Practical machine learning tools andtechniques[M]. Morgan Kaufmann, 2005.结合weka介绍数据挖掘,最大的优点是weka open source
机器学习资料
- TomM
Mitchell,MachineLearning, McGraw-HillScience/Engineering/Mat, 1997,非常早起的机器学习书籍,非常适合入门, 浅显易懂, 但对于工业界应用,只能说是Toy级别的算法。 - Bishop C M,Nasrabadi N M.
Pattern recognition andmachine learning[M]. New York: springer, 2006.进阶型的书籍,对每种算法都有较为具体的理论介绍 - 课程:
机器学习(Stanford->Andrew Ng)http://v.163.com/special/opencourse/machinelearning.html,大名鼎鼎的AndrewNg的机器学习公开课,网易上字幕版本;配合课程stanfordcs229对应的handout及习题一起学习效果更好 - Liu T Y. Learningto rank for information retrieval[J]. Foundations and Trends inInformation Retrieval, 2009, 3(3): 225-331. LTR技术比较全的介绍,包括概念,技术; 同时还包含该领域中具体的开放数据集合, 选择特征的标准等; 在学习基本概念的同时,可以使用这些数据做一做实验。
- Quinlan J R. C4. 5:programs for machine learning[M]. Morgan kaufmann, 1993.超经典的c4.5介绍,学习树模型的同学一定要读下,非常具体,其中包含对离散,连续值,缺失值的处理任何细节。同时有c4.5代码对照,代码参见:
C4.5代码 - http://archive.ics.uci.edu/ml/datasets.html
包含了很多机器学习的数据集,是非常好的学习上手数据
信息检索
- Agirre, Eneko, andPhilip Glenny Edmonds, eds.
Word sensedisambiguation: Algorithms and applications. Vol. 33.Springer Science+ Business Media, 2006. - Manning C D,Raghavan P, Schütze H.
Introduction toinformation retrieval [M]. Cambridge: Cambridge UniversityPress, 2008. - MOFFAT A A, Bell TC.
Managing gigabytes: compressing andindexing documents and images[M]. Morgan Kaufmann,1999.一本很老的介绍搜索引擎的书了,不过09年的时候看还是被震撼到了,书中各种变着戏法使用几十M内存处理上G数据,感觉非常牛叉。 - Liu TY.
Learningto rank for information retrieval[J]. Foundations andTrends in Information Retrieval, 2009, 3(3): 225-331. - Cao Z, Qin T, Liu TY, et al. Learning to rank: from pairwise approach to listwiseapproach[C]//Proceedings of the 24th international conference onMachine learning. ACM, 2007: 129-136. 另外附上《tutorial-lTR by HangLi》《tutorial-LTR by TYLiu》
阅读全文
0 0
- 推荐系统经典论文文献及业界应用
- 推荐系统经典论文文献及业界应用
- 推荐系统经典论文文献及业界应用
- 推荐系统经典论文文献及业界应用
- 推荐系统经典论文文献及业界应用
- 业界netflix的推荐系统
- 推荐系统的近期综述+经典论文及其实现
- 为论文《xml数据库在移动系统中应用研究》所做的文献综述报告
- 推荐系统论文总结
- 推荐系统论文分类推荐
- 推荐系统论文分类推荐
- 推荐系统论文分类推荐
- SVM推荐阅读文献及博客
- 目前业界应用系统框架概览
- 推荐系统论文资料集
- <zz>学者推荐:十年来计算及视觉领域经典的论文介绍
- 论文推荐 推荐系统 Recommender System
- 经典论文:数据库系统架构
- Linux 安装vsftpd
- django CKeditor 正常显示富文本
- Codeforces Round #451 (Div. 2) D. Alarm Clock
- Windows下使用Python配制环境以及打开方式
- 迷宫系列(三)利用BFS/DFS的数据得到最短路/通路
- 推荐系统经典论文文献及业界应用
- 门面模式
- Mahout学习之Mahout简介、安装、配置、入门程序测试
- 职业生涯的思考:产品经理的终极目标-通过产品让生活变得更美好
- TOJ 1048: 简易版最长序列
- 一句话理解复杂语法
- kali 更新修改源 安装中文输入法
- Android 模块化完整方案实现
- 四层和七层负载均衡的区别