python/pandas/Numpy数据分析-统计描述,唯一值,值计数
来源:互联网 发布:微信备案域名 编辑:程序博客网 时间:2024/05/25 21:36
pandas 对象拥有一组常用的数学和统计方法,大部分属于简约统计,用于从Series中提取一个值,或者从DataFrame中提取一列或者一行Series
注意:与NumPy数组相比,这些函数都是基于没有缺失数据的建设构建的,也就是说:这些函数会自动忽略缺失值。
count 非 NA 值的数量describe 针对 Series 或 DF 的列计算汇总统计min , max 最小值和最大值argmin , argmax 最小值和最大值的索引位置(整数)idxmin , idxmax 最小值和最大值的索引值quantile 样本分位数(0 到 1)sum 求和mean 均值median 中位数mad 根据均值计算平均绝对离差var 方差std 标准差skew 样本值的偏度(三阶矩)kurt 样本值的峰度(四阶矩)cumsum 样本值的累计和cummin , cummax 样本值的累计最大值和累计最小值cumprod 样本值的累计积diff 计算一阶差分(对时间序列很有用)pct_change 计算百分数变化
唯一值与值计数
obj=Series(list('cadaabbcc'))uniques=obj.unique()uniquesc 3a 3b 2d 1dtype: int64
排序的话
uniques.sort()uniquesarray(['a', 'b', 'c', 'd'], dtype=object)
value_counts用于计算一个Series中各值出现的频率.
obj.value_counts()a 3d 1b 2c 3dtype: int64
value_counts还是一个顶级pandas方法,可用于任何数组或序列
pd.value_counts(obj.values, sort=False)a 3d 1b 2c 3dtype: int64
0 0
- python/pandas/Numpy数据分析-统计描述,唯一值,值计数
- python数据分析pandas包入门学习(三)汇总和统计描述
- python数据分析pandas包入门学习(三)汇总和统计描述
- python/pandas/numpy数据分析(七)-MultiIndex
- python/pandas/numpy数据分析(十一)-相关系数与协方差
- Python数据分析笔记——Numpy、Pandas库
- Python数据分析模块安装---Numpy、Pandas、Matplotlib
- 《Python数据分析常用手册》一、NumPy和Pandas篇
- python数据分析学习笔记-Numpy-Matplotlib-Pandas
- Python数据分析常用手册——Numpy和Pandas
- 《Python数据分析常用手册》一、NumPy和Pandas篇
- 《Python数据分析常用手册》一、NumPy和Pandas篇
- 《Python数据分析常用手册》一、NumPy和Pandas篇
- Python数据分析值numpy库
- python数据分析---Pandas
- Python 数据分析 pandas
- numpy&pandas 数据分析基础一
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一、pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主
- highcharts图表史上最全的参数配置(属性+事件)
- 蓝桥杯ALGO_04(结点选择)
- 回归原始之JSP
- java中如何用Quartz框架来实现动态定时任务(二)
- centos7 安装Countly - apm应用分析系统
- python/pandas/Numpy数据分析-统计描述,唯一值,值计数
- Gradle原理
- linux下添加tomcat开机自启动
- 小说阅读器
- 蓝桥杯ALGO_05(最短路)
- android studio 单元测试 JUnit
- Java四类八种数据类型
- JDK1.7环境变量配置
- centOS7下部署tomcat后对外开放端口