关于数据缺失问题的总结[转]
来源:互联网 发布:砂的堆积密度试验数据 编辑:程序博客网 时间:2024/05/01 14:22
作者:enova 摘自:《计算机科学论坛》
造成数据缺失的原因
在各种实用的数据库中,属性值缺失的情况经常发全甚至是不可避免的。因此,在大多数情况下,信息系统是不完备的,或者说存在某种程度的不完备。造成数据缺失的原因是多方面的,主要可能有以下几种:
1)有些信息暂时无法获取。例如在医疗数据库中,并非所有病人的所有临床检验结果都能在给定的时间内得到,就致使一部分属性值空缺出来。又如在申请表数据中,对某些问题的反映依赖于对其他问题的回答。
2)有些信息是被遗漏的。可能是因为输入时认为不重要、忘记填写了或对数据理解错误而遗漏,也可能是由于数据采集设备的故障、存储介质的故障、传输媒体的故障、一些人为因素等原因而丢失了。
3)有些对象的某个或某些属性是不可用的。也就是说,对于这个对象来说,该属性值是不存在的,如一个未婚者的配偶姓名、一个儿童的固定收入状况等。
4)有些信息(被认为)是不重要的。如一个属性的取值与给定语境是无关的,或训练数据库的设计者并不在乎某个属性的取值(称为dont-care value)[37]。
5)获取这些信息的代价太大。
6)系统实时性能要求较高,即要求得到这些信息前迅速做出判断或决策。
- 关于数据缺失问题的总结[转]
- 关于数据缺失问题的总结(转贴)
- 关于数据缺失问题的总结(转贴)
- 数据ETL面临的问题----数据缺失
- 关于数据缺失
- LaTeX关于包缺失的问题
- Oracle数据库备份数据缺失的问题
- 关于最新版的ADT的图标缺失问题的解决
- 关于数据存储的问题总结
- 关于NSUserDefaults保存数据的问题总结
- 关于php解决mbstring模块缺失的问题
- 批量读取图片中关于缺失dirent.h的问题
- 关于CodeBlocks中stdc++-6.dll缺失的小问题
- DG关于备库日志缺失gap的问题
- 数据缺失的处理方法
- 数据缺失的中文字符串
- 关于yilia主题模块缺失问题
- 【转】R语言处理缺失数据的高级方法
- 11月5日
- 如何使用定时器settimeout、setInterval执行能传递参数的函数
- 甲流药方--呵呵关注身体健康
- 教练手持终端开发
- Tomcat集群Cluster实现原理剖析文件同步(转贴)
- 关于数据缺失问题的总结[转]
- 格力,我支持你:)
- 初识oracle中的索引组织表
- java第5天的代码
- 脚蹬力硬件开发
- C#控制XML
- 对一批编号为1~100,全部开关朝上(开)的灯进行以下操作:凡是1的倍数反方向拨一次开关;2的倍数反方向又拨一次开关;3的倍数反方向又拨一次开关……问:最后为关熄状态的灯的编号。
- 编程问题-球落地问题(编号1201)----凌风
- Safari 近乎完美!闪电侠苹果Safari 4评测