pandas python 分组统计的方法
来源:互联网 发布:运行java需要什么软件 编辑:程序博客网 时间:2024/06/08 07:16
首先,看看本文所面向的应用场景:我们有一个数据集df,现在想统计数据中某一列每个元素的出现次数。这个在我们前面文章《如何画直方图》中已经介绍了方法,利用value_counts()就可以实现(具体回看文章)
但是,现在,我们考虑另外一个场景,我们假如要想统计其中两列元素出现次数呢?举个栗子:
在df数据集中,如果我们想统计A、B两列的元素的出现情况,也就是说,得到如下表。
从上面的最后一列可以看到,在A、B两列中,1 2 出现了2次,1 4 出现1次 ,1 6出现1次,2 3出现了2次, 2 4 出现1次, 3 1出现了1次
具体实现的代码:
import pandas as pddf=pd.DataFrame([[1,2,2],[1,4,5],[1,2,4],[1,6,3],[2,3,1],[2,4,1],[2,3,5],[3,1,1]],columns=['A','B','C'])
gp=df.groupby(by=['A','B'])gp.size()
所以,如果想统计更多列,只要在groupby()中的by参数添加就可以,例如统计3列。
gp=df.groupby(by=['A','B','C'])
由gp.size()得到的是可以mulitiindex Series。
下面,要转化成DataFrame的结构。
newdf=gp.size()newdf.reset_index(name='times')
其中name中参数就是我们可以为最后一列添加新的名字,例如这里的“times”
这个时候newdf已经是DataFrame的类型了。
阅读全文
2 0
- pandas python 分组统计的方法
- python之pandas分组统计
- python pandas 统计性质
- pandas 常用统计方法
- lucene实现分组统计的方法
- pandas dataframe 分组聚合时,分组组名并入列的方法
- python pandas 聚合与分组函数
- Pandas分组统计函数:groupby、pivot_table及crosstab
- pandas 终极版4:DataFrame统计、合并、分组操作
- Python由词频统计改编的数据分组汇总
- solr 的分组统计
- 分组统计方法:用GroupBy
- python统计词频的方法
- Numpy, Pandas, 及Python原生的排序方法
- python 3.x 安装Matplotlib,Pandas等的方法
- mysql的分组查询、分组统计
- 使用python(pandas)将数据处理成交叉分组表
- python科学计算笔记(六)pandas 分组groupby
- 利用ajax实现文件上传
- Redis的六种特性及使用场景
- HBase列族不能太多的原因
- Android 如何更换系统字体
- Tomcat 安装及使用
- pandas python 分组统计的方法
- C标准库和操作系统api的关系
- 数据结构--栈
- Linux下的ioctl()函数详解
- linux类似命令界面如何出来
- java的JsonObject对象提取值
- 我们该如何理解卷积?
- Linux网络编程--使用epoll模型同时处理tcp和udp服务
- ACM大作业~~