pandas入门——数据分组

来源:互联网 发布:himall 2.6 完整源码 编辑:程序博客网 时间:2024/06/08 14:43

数据分组

  • 数据的导入
f = pd.read_csv("D://NBA.csv", encoding="gbk")print(type(f))print(f.shape)# 按条件进行分组g1 = f.groupby(by=list(["collage"]))print(type(g1))print(g1)
  • 获取分组数据的第一行
print(g1.first())
  • 获取每组的个数
print(g1.size())
  • 获取每一组的描述信息
print(g1.describe())
  • 查看每一组在样本数据中所有的索引位置
print(g1.groups)
  • 选择具体的分组
print(g1.get_group("University of Wisconsin"))
  • 对分组数据进行迭代
for name, group in g1:    print(name)    print("-".center(50, "-"))    print(group.shape)
  • 将函数应用到分组数据上
print(g1.aggregate(numpy.sum))print(g1.aggregate(numpy.mean))
  • 在不同的分组列上应用不同的分组函数
print((g1.aggregate({"height": numpy.sum, "weight": numpy.mean})).rename(columns={"height": "求和", "weight": "平均数"}))
原创粉丝点击