python之pandas分组统计

来源:互联网 发布:电子键盘软件 编辑:程序博客网 时间:2024/06/05 21:57

Pandas分组统计占比

 

数据例如:

美赞臣标签 2017-11-15       MOB      女性 110548715660

美赞臣标签 2017-11-15       MOB      男性 104342715471

美赞臣标签 2017-11-15       PC  女性 398273 887

美赞臣标签 2017-11-15       PC  男性 4691261055

 

处理需求:

分组统计性别占比

 

处理过程如下:

 

import pandas as pd

import numpy as np

df=pd.DataFrame({'key1':['美赞臣2017-11-15MOB','美赞臣2017-11-15MOB','美赞臣2017-11-15PC','美赞臣2017-11-15PC'],'key2':['女性','男鞋','女性','男性'],'imp':[1105487,1045427,3911,3922]})

df


group1=df.groupby(['key1','key2'])

group2=df.groupby(['key1'])

a1=group1.sum().reset_index()

b1=group2.sum().reset_index()

p=pd.merge(a1,b1,how='outer',on='key1')

m=p["imp_x"]/p["imp_y"]

p["rate"]=m

p

处理结果如下:


 





原创粉丝点击