pandas中groupby和pivot_table(数据透视表)

来源:互联网 发布:厦门行知教育 编辑:程序博客网 时间:2024/06/06 01:32

pivot_table(数据透视表)可以看做是一种高级的groupby功能,下面贴两段代码比较一下:

df=pd.read_csv('2016_sale.csv')


a=pd.pivot_table(df,index=['Category','Buyer','Product'],values=['Qty','Amount'],aggfunc={'Qty':(np.sum),'Amount':(np.sum)})
b=df[['Buyer','Category','Product','Amount','Qty']].groupby(['Category','Buyer','Product']).sum()

a和b的结果是一样的,不过明显a的表达式比较灵活,尤其是当对于不同字段有不同聚合函数时(比如有些要SUM,有些要MEAN,可以自定义)。

1 0