利用Python进行数据分析 pandas基础: 处理缺失数据
来源:互联网 发布:自录视频软件 编辑:程序博客网 时间:2024/04/29 02:51
数据不完整在数据分析的过程中很常见。
pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据。
pandas使用isnull()和notnull()函数来判断缺失情况。
对于缺失数据一般处理方法为滤掉或者填充。
滤除缺失数据
对于一个Series,dropna()函数返回一个包含非空数据和索引值的Series,例如:
对于DataFrame,dropna()函数同样会丢掉所有含有空元素的数据,例如:
但是可以指定how='all',这表示只有行里的数据全部为空时才丢弃,例如:
如果想以同样的方式按列丢弃,可以传入axis=1,例如:
填充缺失数据
如果不想丢掉缺失的数据而是想用默认值填充这些空洞,可以使用fillna()函数:
如果不想只以某个标量填充,可以传入一个字典,对不同的列填充不同的值:
0 0
- 利用Python进行数据分析 pandas基础: 处理缺失数据
- 利用Python进行数据分析(10) pandas基础: 处理缺失数据
- 《利用Python进行数据分析》第5章 pandas的数据汇总与处理缺失数据
- 利用Python进行数据分析(12) pandas基础: 数据合并
- 利用Python进行数据分析(14) pandas基础: 数据转换
- 利用Pandas进行数据分析(3)——统计、处理缺失值、层次化索引
- 利用Python进行数据分析(15) pandas基础: 字符串操作
- 利用Python 的 Pandas进行数据分析
- 利用python进行数据分析-pandas入门
- 《利用Python 进行数据分析》pandas 总结
- pandas处理缺失数据
- 利用python进行数据分析(三):pandas--处理数据的工具
- 利用Python进行数据分析(13) pandas基础: 数据重塑/轴向旋转
- 利用 Python 进行数据分析(十二)pandas:数据合并
- 利用 Python 进行数据分析(十二)pandas:数据合并
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一、pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主
- python数据分析pandas包入门学习(四)处理缺失数据
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
- Unity3D的资源管理
- python异步
- 工厂方法模式
- RxJava学习笔记(二)操作符
- Nginx负载均衡配置
- 利用Python进行数据分析 pandas基础: 处理缺失数据
- Java 加载配置文件的方式
- for、foreach、Iterator(二)
- leetcode OJ:190. Reverse Bits
- End-to-End Reinforcement Learning of Dialogue Agents for Information Access
- 反爬虫策略
- 并发控制__锁(mysql)
- js遍历元素取值
- 查看ubuntu16.04下如何将java设置到环境变量的