学习Pandas(六)

来源:互联网 发布:宁泽涛傅园慧cp乐乎 编辑:程序博客网 时间:2024/06/07 21:45

英文原文: 06 - Lesson

我们看一下 groupby 这个函数。

# 导入库import pandas as pdimport sys
print('Python version ' + sys.version)print('Pandas version ' + pd.__version__)
    Python version 3.6.1 | packaged by conda-forge | (default, Mar 23 2017, 21:57:00)     [GCC 4.2.1 Compatible Apple LLVM 6.1.0 (clang-602.0.53)]    Pandas version 0.19.2
# 我们的小数聚集d = {'one':[1,1,1,1,1],     'two':[2,2,2,2,2],     'letter':['a','a','b','b','c']}# 创建一个 dataframedf = pd.DataFrame(d)df
letter one two 0 a 1 2 1 a 1 2 2 b 1 2 3 b 1 2 4 c 1 2

# 创建一个 groupby 对象one = df.groupby('letter')# 在分组上应用 sum() 函数one.sum()
one two letter a 2 4 b 2 4 c 1 2

letterone = df.groupby(['letter','one']).sum()letterone
two letter one a 1 4 b 1 4 c 1 2

letterone.index
    MultiIndex(levels=[['a', 'b', 'c'], [1]],               labels=[[0, 1, 2], [0, 0, 0]],               names=['letter', 'one'])

你可能不想把用来分组的列名字作为索引,像下面的做法很容易实现。

letterone = df.groupby(['letter','one'], as_index=False).sum()letterone
letter one two 0 a 1 4 1 b 1 4 2 c 1 2

letterone.index
   Int64Index([0, 1, 2], dtype='int64')
原创粉丝点击