音乐推荐数据集Million Song Dataset

来源:互联网 发布:细说php第四版pdf下载 编辑:程序博客网 时间:2024/05/01 03:21

最近在看《集体智慧编程》,打算做音乐推荐相关的研究。几经探索,终于找到一个满足自己需求的公开数据集:Million Song Dataset(MSD)。

Million Song是一个开放组织,它致力于音乐信息检索领域的研究,旨在为音乐信息检索相关的研究提供高质量和高可用的公开数据集。一些国外高校如哥大以及国际音乐信息检索组织ISMIR和MSD都有密切的联系和相互支持。

MSD简介 
与其说MSD是一个数据集,还不如说它是一个资源整合平台。它搜集了来自SecondHandSongs dataset 、musiXmatch dataset 、Last.fm dataset、Taste Profile subset、thisismyjam-to-MSD mapping、tagtraum genre annotations 和Top MAGD dataset这7个知名并且权威的音乐社区的数据。当中除了各大音乐网站的原始数据外,MSD还对它们进行了必要的分析和提取;同时也通过MSD自有的track_id来对各大平台的数据进行匹配。MSD包含的数据量和信息量都很多,只要愿意去挖掘,应当能够从中获益。

原创粉丝点击