pandas处理,填充缺失数据

来源:互联网 发布:arduino 网络模块 编辑:程序博客网 时间:2024/05/16 15:19

1、pandas使用浮点值NaN表示浮点和非浮点数组的缺失数据

对于一个Series可以用dropna方法或者通过布尔型索引达到目的

2、对于DataFrame丢弃全NA

丢弃全为NA的那些行

丢弃全为NA的那些列

利用thresh,留下一部分观测数据

thresh=3,表示在行方向上至少有3个非NAN的项保留


填充缺失数据

用fillna的方法,将缺失值替换为常数值

通过一个字典调用fillna实现对不同的列填充不同的值

对reindex有效的那些差值方法也可以用于fillna

fillna函数的参数

value

用于填充缺失值的标量值或者字典对象

method插值方式,如果函数调用时未指定其他参数的话默认值fillaxis待填充的轴默认值axis=0inplace修改调用这对象而不产生副本limit(对于前向和后向填充)可以连续填充的最大数量