Python中如何进行数据分组

来源:互联网 发布:产品网站源码 编辑:程序博客网 时间:2024/05/16 10:14

数据分组

根据数据分析对象的特征,按照一定的数值指标,把数据分析对象划分为不同的区间进行研究,以揭示其内在联系和规律性。
cut 函数:
cut(series,bins,right=True,labels=NULL)
① series  需要分组的数据
② bins    分组的划分数组
③ right   分组的时候,右边是否闭合,默认为闭合True
④ labels  分组的自定义标签,可以不自定义

import pandasdata = pandas.read_csv(    'D:\\PDA\\4.15\\data.csv',     sep='|')#理解为什么我的bins区间要-1和+1bins = [    min(data.cost)-1, 20, 40, 60,     80, 100, max(data.cost)+1]data['cut'] = pandas.cut(    data.cost,     bins)data['cut'] = pandas.cut(    data.cost,     bins,     right=False)labels = [    '20以下', '20到40', '40到60',     '60到80', '80到100', '100以上']data['cut'] = pandas.cut(    data.cost, bins,     right=False, labels=labels)

阅读全文
0 0