Python处理缺失值
来源:互联网 发布:51单片机简易电子琴 编辑:程序博客网 时间:2024/05/22 17:29
首先创建具有缺失值NaN
(Not A Number
)的CSV
(comma-separated values
)文件:
import pandas as pdfrom io import StringIOcsv_data = '''A,B,C,D1.0,2.0,3.0,4.05.0,6.0,,8.00.0,11.0,12.0,'''# If you are using Python 2.7, you need# to convert the string to unicode:# csv_data = unicode(csv_data)df = pd.read_csv(StringIO(csv_data))
删除含缺失值的样本
具体处理方法:
df.isnull()
#是缺失值返回True,否则范围Falsedf.isnull().sum()
#返回每列包含的缺失值的个数df.dropna()
#直接删除含有缺失值的行df.dropna(axis = 1)
#直接删除含有缺失值的列df.dropna(how = 'all')
#只删除全是缺失值的行df.dropna(thresh = 4)
#保留至少有4个缺失值的行df.dropna(subset = ['C'])
#删除含有缺失值的特定的列
填充缺失值
数值型数值(Numerical Data
)
方法一:fillna()
函数
df.fillna(0)
:用0填充df.fillna(method='pad')
:用前一个数值填充df.fillna(df2.mean())
:用该列均值填充
方法二:Imputer
from sklearn.preprocessing import Imputerimr = Imputer(missing_values='NaN', strategy='mean', axis=0)#均值填充缺失值imr = imr.fit(df)imputed_data = imr.transform(df.values)
阅读全文
0 0
- Python处理缺失值
- Python 中的缺失值及其处理
- Python处理缺失数据
- Python中重复值、缺失值、空格值处理
- 每天一点python——缺失值处理
- 每天一点python——缺失值处理
- python解决pandas处理缺失值为空字符串
- python之setdefault()和defaultdict()处理缺失值的键
- python 数据预处理(采用拉格朗日插值法处理缺失值)
- 缺失值处理
- 缺失值处理
- 缺失值的处理
- 缺失值处理方法
- 缺失值处理
- 缺失值的处理
- 缺失值处理方法
- pandas处理缺失值
- panda缺失值处理
- js弹出层评论前判断是否要登录
- pod install 慢
- Spring 使用注解方式进行事务管理
- Shell的使用
- ios集成Charts框架并绘制柱形图详解
- Python处理缺失值
- js中cookie的使用
- Struts2框架学习(三) 数据处理
- CSS3 常用四个动画(旋转、放大、旋转放大、移动)
- my life sentence
- Android高级UICanvas和Path使用——自定义SearchView搜索框动画
- eMMC应用教程:关于RPMB的应用
- 初见蓝桥——历年试题 地宫寻宝
- WebView 渲染加速