python merge()&groupby()

来源:互联网 发布:java之父有多牛 编辑:程序博客网 时间:2024/06/06 02:06

以下内容简单介绍merge和groupby在数据处理时常用的形式。
1.merge()

这里写图片描述
使用方法一:
merge(df1,df2,on=’key’,how=’left’)

======================================================================================
df1,df2:
要混合的两个dataframe,
on:
混合关键词列,
how:
混合方式。
left:
以左边dataframe为标准按左边dataframe标准去搜索右边的dataframe。

======================================================================================

搜索流程:
①确定左边dataframe的key。
②按键搜索右边dataframe。
③列出。

======================================================================================

使用方法二:
A=A.merge(B,how=’left’,on=[])
A为混合主体,on指定一组列作为key。

注:由于合并后常常存在空值NaN,因此常与fillna(x)函数联用,其中x代表要填充进NaN的值。

======================================================================================

gruopby():

df.grouby([‘column1’,’column2’])[‘column3’].func()
根据func指定处理形式合并df中含有相同[‘column1’,’column2’]的行。
[‘column3’]表被无视的一列,最后变为‘’计数‘’列。
这里写图片描述
另外,可以使用apply()函数使运用更加灵活。
注:合并时无视df中其他的列。

原创粉丝点击