数据中的缺失值处理

来源:互联网 发布:查询域名是否已备案 编辑:程序博客网 时间:2024/05/01 23:14
  • 使用可用特征的均值来填补缺失值;
  • 使用特殊值来填补缺失值,如-1;
  • 忽略有缺失值的样本;
  • 使用相似样本的均值添补缺失值;
  • 使用另外的机器学习算法预测缺失值。

如果在测试数据集中发现了一条数据的类别标签已经缺失,那么我们的简单做法是将该条数据丢弃。
这是因为类别标签与特征不同,很难确定采用某个合适的值来替换。

原创粉丝点击