Pands分组统计函数
来源:互联网 发布:沃尔玛的物流网络 编辑:程序博客网 时间:2024/05/21 16:01
利用Python的pandas库进行数据分组分析十分便捷,其中应用最多的方法包括:groupby、pivot_table及crosstab,以下分别进行介绍。
0、样例数据
1、分组groupby
Pandas中最为常用和有效的分组函数。
1)按列分组
注意以下使用groupby()函数生成的group1是一个中间分组变量,为GroupBy类型。
既可依据单个列名’key1’进行为分组,也可依据多个列名['key1','key2']进行分组。
使用推导式[x for x in group1]可显示分组内容。
2)按分组统计
在分组group1、group2上应用size()、sum()、count()等统计函数,能分别统计分组数量、不同列的分组和、不同列的分组数量。
3)应用agg()
对于分组的某一列或者多个列,应用agg(func)可以对分组后的数据应用func函数。例如:用group1['data1'].agg('mean')对分组后的’data1’列求均值。当然也可以推广到同时作用于多个列和使用多个函数上。
4)应用apply()
apply()不同于agg()的地方在于:前者应用于dataframe的各个列,后者仅作用于指定的列。
2、透视表pivot_table
可以产生类似于excel数据透视表的结果,相当的直观。
1)分组统计
其中参数index指定“行”键,columns指定“列”键。
2)分项汇总
如果将参数margins设置为True,则可以得到分项总计数据。
3、交叉表crosstab
可以按照指定的行和列统计分组频数,用起来非常方便;当然同样的功能也可采用groupby实现。
很幸运能够有这么多好用的方法,大大简化了数据分组分析的过程。
0 0
- Pands分组统计函数
- Pands函数相关
- Oracle 分组统计函数
- orcale 统计函数 分组查询
- 组函数及分组统计
- 统计函数与分组查询
- Oracle分组统计查询-统计函数
- Oracle之组函数、分组统计
- oracle分组汇总统计函数grouping
- Oracle统计函数及分组查询
- oracle 统计函数及分组查询
- SQL统计函数及分组操作
- oracle数据库(统计函数和分组查询)
- 分组统计
- 分组统计
- 分组统计
- 分组统计
- 分组统计
- 程序设计入门week3:数字特征值(c中如何使用次方)
- input输入控件的新类型
- Oauth和Oauth2.0的区别
- 去掉FreeMind的红色波浪线,关闭拼写检查
- 字符串比较函数 String类compareTo()
- Pands分组统计函数
- 一个Tomcat下部署两个,甚至多个项目
- 程序的内存分配
- 第三天
- iOS开发之DKNightVersion的原理和使用,实现夜间模式
- 编程第五六天
- MySQL性能优化
- 走进 Redis 的世界
- IDEA的入门使用(一)——快捷键