python数据分析pandas包入门学习(三)汇总和统计描述
来源:互联网 发布:下载福州网络家长学校 编辑:程序博客网 时间:2024/06/05 20:10
本文参考《利用Python进行数据分析》的第五章 pandas入门
pandas拥有一组常用的数学和统计方法。它们大部分属于约简和汇总统计,用于从Series中提取单个值(如sum和mean),或从DataFrame的行或列中提取一个Series。跟对应的Numpy数组方法相比,它们都是基于没有缺失数据的假设而构建的。
idxmin()/idxmax():返回最小值最大值的索引
cumsum():返回列累积和
describe():产生汇总统计
相关系数和协方差corr(), cov()
协方差cov():表示线性相关的方向,取值正无穷到负无穷。协方差为正值,说明一个变量变大另一个变量也变大;协方差取负值,说明一个变量变大另一个变量变小,取0说明两个变量咩有相关关系。
相关系数corr():不仅表示线性相关的方向,还表示线性相关的程度,取值[-1,1]。也就是说,相关系数为正值,说明一个变量变大另一个变量也变大;取负值说明一个变量变大另一个变量变小,取0说明两个变量没有相关关系。同时,相关系数的绝对值越接近1,线性关系越显著。
下图为计算a列和b列的相关系数corr()和协方差cov():
corrwith():计算DataFrame的列(axis=0,默认)或行(axis=1)跟另外一个Series或DataFrame之间的相关系数:
唯一值、值计数以及成员资格
unique():得到Series中的唯一值数值:
value_counts():计算一个Series中各值出现的频率(默认降序排列):
isin():判断成员资格,用于选取Series中或DataFrame列中数据的子集:
0 0
- python数据分析pandas包入门学习(三)汇总和统计描述
- python数据分析pandas包入门学习(三)汇总和统计描述
- python数据分析pandas包入门学习(二)基本功能
- python:pandas(3),汇总和计算描述统计
- python数据分析pandas包入门学习(一)pandas数据结构介绍
- Python 数据分析包:pandas 入门
- python数据分析pandas包入门学习(四)处理缺失数据
- 数据分析之Pandas(三):汇总、统计、相关系数和协方差
- 利用Python数据分析:pandas入门(三)
- 利用Python进行数据分析(9) pandas基础: 汇总统计和计算
- python-pandas 描述和汇总统计表
- python数据分析(pandas入门)
- python/pandas/Numpy数据分析-统计描述,唯一值,值计数
- Python数据分析模块 | pandas做数据分析(三):统计相关函数
- Python 数据分析包:pandas 基础
- Python 数据分析包:pandas 基础
- Python 数据分析包:pandas 基础
- Python 数据分析包:pandas 基础
- java反射
- TopSort(拓扑排序)
- node日志管理模块log4js
- C++:CString和string区别及其转化(转)
- MergeSort归并排序
- python数据分析pandas包入门学习(三)汇总和统计描述
- apk反编译
- ViewPager
- linux---tr,col,join,paste,expand 字符转换命令
- JSON.parse()和JSON.stringify()
- 求线段长
- okhttp教程
- 通过url启动Jenkins
- 队列(约瑟夫环)