音乐推荐数据集Million Song Dataset

来源:互联网 发布:域名top区别 编辑:程序博客网 时间:2024/04/30 21:08

由于毕业论文打算做音乐推荐相关的研究,所以有一段时间都花在了音乐数据集的调研上。几经探索,终于找到一个满足自己需求的公开数据集:Million Song Dataset(MSD)。

Million Song是一个开放组织,它致力于音乐信息检索领域的研究,旨在为音乐信息检索相关的研究提供高质量和高可用的公开数据集。一些国外高校如哥大以及国际音乐信息检索组织ISMIR和MSD都有密切的联系和相互支持。

MSD简介
与其说MSD是一个数据集,还不如说它是一个资源整合平台。它搜集了来自SecondHandSongs dataset 、musiXmatch dataset 、Last.fm dataset 、Taste Profile subset、thisismyjam-to-MSD mapping、tagtraum genre annotations 和Top MAGD dataset这7个知名并且权威的音乐社区的数据。当中除了各大音乐网站的原始数据外,MSD还对它们进行了必要的分析和提取;同时也通过MSD自有的track_id来对各大平台的数据进行匹配。MSD包含的数据量和信息量都很多,只要愿意去挖掘,应当能够从中获益。

0 0