R读书笔记之特征工程(一)空值处理
来源:互联网 发布:java开源博客系统源码 编辑:程序博客网 时间:2024/06/03 07:46
在特征处理中,会有空值的删除或者填充。
一:删除
1一般删除是最简单的,用na.omit(data)就搞定,但是太粗暴了。
2若是有的观测量空缺值太多的话,确实需要删除,因为用别的方法填充反而会导致模型偏差。
那么肿么统计观测量的空值的个数捏?可以参考函数:apply(dataframe,1,function(x) sum(is.na(x))),其中is.na()返回
一个逻辑向量,求和时T为1,F为0,因此求和返回的是该行观测量空值的个数。
用函数manyNAs(data,0.2)可以返回data中空值数量大于列数20%的行,因此可以data[-manyNAs(data,0.2),]快速对应
行,0.2参数可以自己修改。
二:填充
待续
0 0
- R读书笔记之特征工程(一)空值处理
- 机器学习之特征工程(一)
- 特征工程(一)
- 特征工程(3)--特征处理
- R语言之处理数据(一)
- 特征工程大满贯(一)
- 浅谈特征工程(一)
- 特征处理(一)
- 【读书笔记】互联网广告综述之点击率特征工程
- Spark机器学习API之特征处理(一)
- 图像处理之图像特征提取之(一)HOG特征
- 特征工程之连续特征与离散特征处理方法介绍
- 特征工程之连续特征与离散特征处理方法介绍
- 最优化读书笔记R(一)
- 《R实战》读书笔记一
- 机器学习之特征工程(二)
- 十八、R语言特征工程实战
- 特征工程与文本处理
- Android之基于xmpp openfire smack开发之smack类库介绍和使用[2]
- 进程栈与线程栈
- swift学习日记(八)构造 析构
- Java基础--面向对象(静态、main函数、帮助文档、单例设计模式)
- 将PPT文件内容转换为图片放在Email邮件正文中发送
- R读书笔记之特征工程(一)空值处理
- HDU2844:Coins
- Java HeadFirst 系列 一
- 在Spring下集成ActiveMQ
- STL_6: STL标准库
- 从键盘按下enter键,执行下一步代码操作
- 喝酒不骑马的Android自学日记(7)-ListView监听器&&Date/TimePicker介绍
- NSURLCache内存缓存
- 《人件》 读后感