pandas排序与统计
来源:互联网 发布:python 元组添加元素 编辑:程序博客网 时间:2024/06/14 16:18
《Python for Data Analysis》
排序
sort_index()
对行或列索引进行排序
In [1]: import pandas as pdIn [2]: from pandas import DataFrame, SeriesIn [3]: obj = Series(range(4), index=['d','a','b','c'])In [4]: objOut[4]:d 0a 1b 2c 3dtype: int64In [5]: obj.sort_index()Out[5]:a 1b 2c 3d 0dtype: int64In [6]: import numpy as npIn [8]: frame = DataFrame(np.arange(8).reshape((2,4)), index=['three','one'], ...: columns=['d','a','b','c'])In [9]: frameOut[9]: d a b cthree 0 1 2 3one 4 5 6 7In [10]: frame.sort_index()Out[10]: d a b cone 4 5 6 7three 0 1 2 3In [11]: frame.sort_index(axis=1)Out[11]: a b c dthree 1 2 3 0one 5 6 7 4In [12]: frame.sort_index(axis=1, ascending=False)Out[12]: d c b athree 0 3 2 1one 4 7 6 5
sort_values
对Series按值进行排序, 排序时,任何缺失值默认都会被放到Series的末尾。
In [18]: obj = Series([4, np.nan, 6, np.nan, -3, 2])In [19]: objOut[19]:0 4.01 NaN2 6.03 NaN4 -3.05 2.0dtype: float64In [21]: obj.sort_values()Out[21]:4 -3.05 2.00 4.02 6.01 NaN3 NaNdtype: float64
在DataFrame上,根据一个或多个列中的值进行排序。将一个或多个列的名字传递给by
选项即可达到该目的:
In [16]: frame.sort_values(by='b')Out[16]: d a b cthree 0 1 2 3one 4 5 6 7
汇总和统计
sum
、mean
、max
约简方法的选项
间接统计
idxmin
, idxmax
:达到最小值或最大值的索引。
累积型
cumsum
针对列进行汇总统计
df.describe
:数值型和非数值型不同。
相关系数和协方差
corr()
: 相关系数
cov()
:协方差
唯一值、值计数以及成员资格
unique
:可以得到Series中的唯一值数组。
isin
:用于判断矢量化集合的成员资格
value_counts
:用于计算一个Series中各值出现的概率。
2 0
- pandas排序与统计
- Numpy与Pandas排序
- pandas数值计算与排序
- Pandas数值计算与排序
- Python-Pandas(2)数值计算与排序
- 字符串排序与统计
- pandas排序
- pandas排序
- Pandas 描述统计函数
- pandas 常用统计方法
- 入手pandas分析统计
- Pandas统计特征函数
- python pandas 统计性质
- pandas 数据统计
- pandas小记:pandas计算工具-汇总统计
- pandas小记:pandas计算工具-汇总统计
- 算法--计数排序与统计计数排序
- pandas描述性统计 (1)
- android Java 打印堆栈的几种方法
- 3D Math Primer for Graphics and Game Development Second Edition
- 使用tspan元素给SVG文本添加样式、定位
- cocos2d-x中ccui.checkbox的使用方法
- JSP中文乱码
- pandas排序与统计
- java 实现监听器简例 listener
- visio调整画布大小和画大括号
- 注解学习:实现简单的junit的@test注解
- lscpu
- 关于如何html如何读取后台缓存数据
- 一个学习js还可以的网站
- Lua中table的常用操作
- spring transaction事务