EMI音乐推荐竞赛

来源:互联网 发布:linux红帽5安装oracle 编辑:程序博客网 时间:2024/05/01 02:09

本届EMI音乐推荐竞赛(EMI Music Data Science Hackathon)的目的,是预测一个用户是否会喜欢新发行的专辑或单曲。数据是由百代唱片提供的真实的采访数据,历时两年,一共涉及5万多个不同的用户。

这次赛事的主会场设在伦敦,也吸引了来自世界各地的队伍在网上同时参与竞争。参赛队伍中不乏来自剑桥、牛津、密歇根大学以及澳洲国立大学等国际知名院校的顶尖学者,其中,德国康斯坦茨大学的Steffen(Libfm的作者)是在Kaggle上排名前三的选手。

由于比赛时间恰好在周末,我们6个人组成的同事军团也决定凑凑热闹。经过24小时的连续奋战,我们开发的算法最终以13.245的RMSE成绩夺得了冠军!这是继KDD CUP 2012上获得track 1的亚军之后,我们在专业领域的又一次突破,激动之情真是不能言表。过程甚是紧张刺激,一波三折。

对一个表现良好的推荐系统,对数据的理解和对模型细节的把握,可谓缺一不可。在用户对item的反馈信息不足时,尤其对新的用户和item,搜集尽可能多的信息来努力把握用户的喜好,是实际推荐系统必须面对的场景。对这一点,不论今年的KDD CUP和这次音乐推荐比赛,都在数据和结果上有充分的体现。

以后有时间写一些算法体会。推荐系统是一个很微妙的领域,虽然有一些相关的简单实用的算法,也足以应付一些简单的推荐场景(例如站内的相关产品推荐);但在把握用户的喜好上总感觉有很大的提升空间,更别说对跨领域或者复杂场景推荐的问题,现在还没有特别成功的产品出现。推荐系统的前景很好,但要走的路还很长。

原创粉丝点击