Python数据分析基础(七)——数据聚合与分组

来源:互联网 发布:淘宝网店代理 编辑:程序博客网 时间:2024/05/21 02:34

将数据集准备好之后,通常的任务是计算分组统计或生成透视表。下面讲解

DataFrame关于聚合相关方法。


经过优化的groupby的方法

函数名说明count分组中非NA值的数量sum非NA值的和mean非NA值的平均值median非NA值的算术中位数std、var无偏(分母为n-1)标准差和方差min、max非NA值的最小值和最大值prod非NA值的积first、last第一个和最后一个非NA值


pivot_table的参数

参数说明values待聚合的列的名称。默认聚合所有数值列rows用于分组的列名或其他分组键,出现在结果透视表的行cols用于分组的列名或其他分组建,出现在结果透视表的列aggfunc聚合函数或函数列表,默认为“mean”fill_value用于替换结果表中的缺失值margins添加行/列小计和总计,默认为False


参考文献:

利用Python进行数据分析.    Wes McKinney.    唐学韬译


原创粉丝点击