《用python进行数据分析》语法要点总结(2)
来源:互联网 发布:襄阳网络广播电视台 编辑:程序博客网 时间:2024/05/18 14:26
movielens小程序
(1)打开dat文件,用pd.read_table,说明分隔符是::
(2)pd.merge的默认设置 data = pd.merge(pd.merge(ratings, users),movies)#pd根据列推断出来怎么合并
没有指定连接键,默认用重叠列名,没有指定连接方式
(3)sort_by_diff[::-1][:10]#对结果取反,男性最喜欢的电影
整个程序比较简单:
import pandas as pdunames=['user_id','gender','age','occupation','zip']users=pd.read_table('users.dat',sep='::',header=None,names=unames)rnames=['user_id','movie_id','rating','timestamp']ratings=pd.read_table('ratings.dat',sep='::',header=None,names=rnames)mnames=['movie_id','title','genres']movies=pd.read_table('movies.dat',sep='::',header=None,names=mnames)data = pd.merge(pd.merge(ratings, users),movies)#pd根据列明推断出来怎么合并mean_ratings = data.pivot_table('rating',index='title',columns='gender',aggfunc='mean')rate_by_title = data.groupby('title').size()active_title = rate_by_title.index[rate_by_title>=250]top_female_ratings = mean_ratings.sort_index(by='F',ascending = False)mean_ratings['diff'] = mean_ratings['M']-mean_ratings['F']sort_by_diff = mean_ratings.sort_index(by='diff') #分歧最大且女性最喜欢的电影sort_by_diff[::-1][:10]#对结果取反,男性最喜欢的电影rating_std_by_title = data.groupby('title')['rating'].std()rating_std_by_title = rating_std_by_title.ix[active_title]print (rating_std_by_title.sort_values(ascending = False)[:10] ) #sort_values
阅读全文
0 0
- 《用python进行数据分析》语法要点总结(2)
- 《用python进行数据分析》语法要点总结(1)
- 《利用python 进行数据分析》要点记录
- 《利用Python 进行数据分析》pandas 总结
- 利用python 进行数据分析全书总结
- MovieLens 《用Python进行数据分析》
- 《利用Python 进行数据分析》 - 笔记(2)
- python进行数据分析 chapter 2-1
- 运用python进行数据分析 -- numpy 2
- 利用Python进行数据分析(一)
- 利用Python进行数据分析(二)
- 利用Python进行数据分析(三)
- 利用Python进行数据分析(四)
- Python入门语法要点
- 用Python做数据分析:Pandas常用数据查询语法
- 微信小程序技术分析:Mustache语法要点总结
- 微信小程序技术分析:Mustache语法要点总结
- 使用python进行数据分析
- 三代数据仓库的演进历程以及新一代数仓与区块链的关系
- Java_代码优化
- NOIP2017升天记
- 什么时候用GET,什么时候用POST?
- python模块学习(threading模块中的Event类)
- 《用python进行数据分析》语法要点总结(2)
- Android ExifInterface 图片信息 读取时中文乱码解决方案
- 编辑器指定位大小写变换
- 自动刷新界面方法,兼容问题
- springMVC+微信小程序之灵异事件,犯错提醒
- nodejs 访问mysql数据库超时的bug解决
- 将文本数据转到数据库中
- 关于servlet中doPost()或doGet()方法不执行的问题?
- shell删除一个文件夹下的多个文件