机器学习(6) MovieLens数据集
来源:互联网 发布:php 缩略图 编辑:程序博客网 时间:2024/05/18 01:11
MovieLens数据集是一个关于电影评分的数据集,里面包含了从IMDB, The Movie DataBase上面得到的用户对电影的评分信息,详细请看下面的介绍。
介绍:
links.csv:
文件里面的内容是帮助你如何通过网站id在对应网站上找到对应的电影链接的。数据格式如下:
movieId, imdbId, tmdbId
movieId:表示这部电影在movielens上的id,可以通过链接https://movielens.org/movies/(movieId)来得到。
imdbId:表示这部电影在imdb上的id,可以通过链接http://www.imdb.com/title/(imdbId)/
来得到。
tmdbId:表示这部电影在themoviedb上的id,可以通过链接http://www.imdb.com/title/(tmdbId)/
来得到。
movies.csv:
movieId, title, genres
文件里包含了一部电影的id和标题,以及该电影的类别。数据格式如下:
movieId, title, genres
movieId:每部电影的id
title:电影的标题
genres:电影的类别(详细分类见readme.txt)
ratings.csv:
文件里面的内容包含了每一个用户对于每一部电影的评分。数据格式如下:
userId, movieId, rating, timestamp
userId: 每个用户的id
movieId: 每部电影的id
rating: 用户评分,是5星制,按半颗星的规模递增(0.5 stars - 5 stars)
timestamp: 自1970年1月1日零点后到用户提交评价的时间的秒数
数据排序的顺序按照userId,movieId排列的。
tags.csv:
文件里面的内容包含了每一个用户对于每一个电影的分类。数据格式如下:
userId, movieId, tag, timestamp
userId: 每个用户的id
movieId: 每部电影的id
tag: 用户对电影的标签化评价
timestamp: 自1970年1月1日零点后到用户提交评价的时间的秒数
数据排序的顺序按照userId,movieId排列的。
README.txt
下载链接:
官网地址: https://grouplens.org/datasets/movielens/
ml-latest-small(1MB): http://files.grouplens.org/datasets/movielens/ml-latest-small.zip
ml-latest(234.2MB): http://files.grouplens.org/datasets/movielens/ml-latest.zip
读取方法
利用Python的csv模块进行读取操作。
import csvwith open(file_url, 'r') as f: data = csv.reader(f) for i in data: print(i)
- 机器学习(6) MovieLens数据集
- Movielens数据集详细介绍
- movielens数据集.dat文件导入msql
- 电影数据集总结:Netflix、MovieLens、LDOS-CoMoDa、AdomMovie
- 使用FEA Spk探索经典数据集MovieLens
- 用pandas处理MovieLens 1m 数据集
- 机器学习数据集
- 机器学习数据集
- 机器学习数据集
- 机器学习数据集
- 机器学习数据集
- 机器学习-数据集
- 机器学习数据集
- 机器学习数据集
- 机器学习数据集
- movielens大数据存储技巧
- 利用Python进行数据分析---ch02《MovieLens 1M数据集(上)》读书笔记
- 利用Python进行数据分析---ch02《MovieLens 1M数据集(下)》读书笔记
- android 旧版actionbar升级toolbar出现的问题
- 简单八皇后
- js排序
- CentOS php5安装Redis以及php-redis扩展
- JS模块化
- 机器学习(6) MovieLens数据集
- Systemd 入门教程:实战篇
- 使用HBuilder操作H5
- JVM gc打印日志字段说明
- 笔记-NopCommerce系统架构分析-插件机制
- Ubuntu安装samba服务
- Oracle健康监控及健康检查(Health Monitor)
- LibreOJ β Round #2 A. 模拟只会猜题意【前缀和】
- 商标异议申请的流程