python之pandas分组统计
来源:互联网 发布:电子键盘软件 编辑:程序博客网 时间:2024/06/05 21:57
Pandas分组统计占比
数据例如:
美赞臣标签 2017-11-15 MOB 女性 110548715660
美赞臣标签 2017-11-15 MOB 男性 104342715471
美赞臣标签 2017-11-15 PC 女性 398273 887
美赞臣标签 2017-11-15 PC 男性 4691261055
处理需求:
分组统计性别占比
处理过程如下:
import pandas as pd
import numpy as np
df=pd.DataFrame({'key1':['美赞臣2017-11-15MOB','美赞臣2017-11-15MOB','美赞臣2017-11-15PC','美赞臣2017-11-15PC'],'key2':['女性','男鞋','女性','男性'],'imp':[1105487,1045427,3911,3922]})
df
group1=df.groupby(['key1','key2'])
group2=df.groupby(['key1'])
a1=group1.sum().reset_index()
b1=group2.sum().reset_index()
p=pd.merge(a1,b1,how='outer',on='key1')
m=p["imp_x"]/p["imp_y"]
p["rate"]=m
p
处理结果如下:
阅读全文
0 0
- python之pandas分组统计
- pandas python 分组统计的方法
- python pandas 统计性质
- python pandas 聚合与分组函数
- 分组统计之facet
- Solr之分组统计。
- python之pandas说明
- python之pandas(一)
- python之pandas
- python之pandas学习
- Python之pandas基础
- Python之Pandas库
- Python之Pandas(1)
- python基础之pandas
- python 之 pandas 详解
- Python之Pandas库
- Python之pandas小结
- python之pandas库
- Understanding Deep Learning required Rethinking Generalization 笔记
- cesium 读取json
- HMAC-SHA1签名工具类
- 链表中倒数第k个结点
- 偏导数与全导数的关系 以及 偏微分与全微分的关系
- python之pandas分组统计
- Java并发线程池,ThreadPoolExecutor解析
- [ArcGIS] 空间分析(三)栅格数据
- 枚举的总结
- 转:正则表达式进阶(资料整理)
- Linux 安装Elasticsearch和配置ik分词器步骤
- kafka与zookeeper间的关联
- 卷积神经网络中每层矩阵维度变化
- Tomcat各种启动方式的jvm内存设置