DataFrame如何根据一列来计算另一列出现的次数

来源:互联网 发布:windows movie make 编辑:程序博客网 时间:2024/05/16 06:16

我们使用groupby这个分组函数吧。
我们给出数据集。
我们想统计每个u对应的a,并统计同一个a下面u的出现次数;
代码如下:

df = pd.DataFrame({'a':[1,1,1,3,3,3,3,3,3,3,3,8],'u':[99,98,67,65,63,67,57,55,51,53,53,55]})dfOut[72]:     a   u0   1  991   1  982   1  673   3  654   3  635   3  676   3  577   3  558   3  519   3  5310  3  5311  8  55gropus=df.groupby(['a'])row = {'a':[],'u':[],'第几次出现':[]}for k,group in gropus:    row['a'] += group.a.values.tolist()    row['u'] += group.u.values.tolist()    row['第几次申请'] += ((group.index-group.index[0])%group.index.size+1).values.tolist()pd.DataFrame(row)Out[73]:     a   u  第几次出现0   1  99      11   1  98      22   1  67      33   3  65      14   3  63      25   3  67      36   3  57      47   3  55      58   3  51      69   3  53      710  3  53      811  8  55      1
阅读全文
0 0
原创粉丝点击