Pandas+groupby用法讲解
来源:互联网 发布:编程图片素材 编辑:程序博客网 时间:2024/06/04 18:41
import pandas as pdimport numpy as np
#导入数据type_specified={"trip_id":"object","bikeid":"object","from_station_id":"object","to_station_id":"object", "hour":"object","weekday":"object"}ridership=pd.read_csv(r"E:\chicago_bikes_data\txt&csv\ridership_2016.txt", nrows=10000,dtype=type_specified,usecols=range(1,15))
ridership.head()
#groupby可以通过传入需要分组的参数实现对数据的分组ridership_user=ridership.groupby("usertype")ridership_user_week=ridership.groupby(["usertype","weekday"])
#groupby之后的数据并不是DataFrame格式的数据,而是特殊的groupby类型,此时,可以通过size()方法返回分组后的记录数目统计结果,该结果#是Series类型ridership_user.size()
usertypeCustomer 1023Subscriber 8977dtype: int64
ridership_user_week.size()
usertype weekdayCustomer 3 286 4 737Subscriber 3 2714 4 6263dtype: int64
#可以通过索引的方式实现对分组后各类别记录数的提取ridership_user_week.size().loc["Customer","3"]
286#通过groupby完成对数据的分组后,可以通过get_group方法来获取某一制定分组的结果
ridership_user.get_group("Customer").head()
#对于多层分组后的数据,如果需要使用多重索引,此处需要传入一个元组ridership_user_week.get_group(("Customer","3")).head()
#对于分组后的数据,如果还需要进行一系列查询,可以使用apply方法,传入一个处理的函数#假设我们需要查找上述分组后每组中用时最长的一组记录的起始和终止站点,可执行如下命令
max_time_from_id=ridership_user_week.apply(lambda record:record["from_station_id"][record["tripduration"].idxmax()])max_time_to_id=ridership_user_week.apply(lambda record:record["to_station_id"][record["tripduration"].idxmax()])max_time_time=ridership_user_week.apply(lambda record:record["tripduration"][record["tripduration"].idxmax()])max_time_ridership=pd.DataFrame({"from_station_id":max_time_from_id,"to_station_id":max_time_to_id, "tripduratio":max_time_time})
max_time_ridership
阅读全文
0 0
- Pandas+groupby用法讲解
- 关于pandas.DataFrame的groupby的用法
- 简要说明python pandas中groupby,agg等的用法
- pandas groupby重写Q3
- pandas groupby 最大最小值
- Pandas GroupBy对象
- pandas 的groupby函数
- pandas groupby使用
- pandas groupby 详解
- pandas--系列之groupby
- pandas中Timestamp类用法讲解
- pandas groupby (TimeGrouper)重写Q3
- 理解pandas的groupby().apply()
- pandas-如何保存groupby函数的结果?
- pandas聚合和分组运算之groupby
- Pandas GroupBy 分组(分割-应用-组合)
- Pandas GroupBy对象 索引与迭代
- pandas函数应用篇之GroupBy.apply
- STK卫星工具箱下载
- 机器学习scikit-learn入门教程
- 练习 1-14 编写一个程序,打印输入中各个字符出现频度的直方图
- Linux下的虚拟地址映射详解(二)线性地址到物理地址的映射
- JAVA之StringBuilder类
- Pandas+groupby用法讲解
- java鬼混笔记:lucene 9、查询结果高亮
- 使用 Python爬取龙珠超下载链接地址
- mongodb删库札记
- 转载(springmvc+spring+mabatis)配置
- 1.基础语法(2)变量
- 一、ajax基础语法使用(Ajax入门)
- bzoj3400 [Usaco2009 Mar]Cow Frisbee Team 奶牛沙盘队
- 面试中遇到的有趣的小问题