数据离散化的意义
来源:互联网 发布:服务器网络架构 编辑:程序博客网 时间:2024/06/05 20:25
数据离散化是指将连续的数据进行分段,使其变为一段段离散化的区间。分段的原则有基于等距离、等频率或优化的方法。数据离散化的原因主要有以下几点:
1**.算法需要:**
比如决策树、朴素贝叶斯等算法,都是基于离散型的数据展开的。如果要使用该类算法,必须将离散型的数据进行。有效的离散化能减小算法的时间和空间开销,提高系统对样本的分类聚类能力和抗噪声能力。
2**.离散化的特征相对于连续型特征更易理解,更接近知识层面的表达**
比如工资收入,月薪2000和月薪20000,从连续型特征来看高低薪的差异还要通过数值层面才能理解,但将其转换为离散型数据(底薪、高薪),则可以更加直观的表达出了我们心中所想的高薪和底薪。
3.可以有效的克服数据中隐藏的缺陷,使模型结果更加稳定
阅读全文
0 0
- 数据离散化的意义
- 连续特征的离散化的意义
- 特征工程--特征离散化的意义
- 数据的离散化
- 数据的离散化
- 数据的离散化
- 数据的离散化
- 数据的离散化
- 数据的离散化
- 数据的离散化
- 数据的离散化
- 数据的离散化处理
- 数据的离散化处理
- 数据的离散化-lower_bound
- 浅谈数据的离散化
- 数据的离散化 STL用法
- 数据离散化杂谈
- 数据离散化
- Python之路【第八篇】:堡垒机实例以及数据库操作
- RBAC 权限控制设计
- oracle相关设置
- H5六人牛牛源码合集代码分享
- sort 在字符串中的用法(洛谷di12题)
- 数据离散化的意义
- Import cv2 ImportError:DLL load failed:找不到指定模块 解决方法
- 利用LSTM预测股票日最高价
- 【Spring】SpringSecurity的过滤器执行流程
- 怎么用IDEA上传本地项目到码云/Github?
- Django报错403 Forbidden. CSRF token missing or incorrect的解决办法
- 数据库--PostgreSQl安装
- sql 时间
- Gradle2.0用户指南翻译——第十二章. 使用Gradle 图形用户界面