【机器学习】数据离散化
来源:互联网 发布:建设项目经济评价软件 编辑:程序博客网 时间:2024/06/11 03:34
首先要知道为什么要做数据离散化,例:
晴天 阴天下雨
猫 狗猪
如果不做离散化,我们把晴天标注为1,阴天标注为2,下雨标注为3,那么对于计算机来说1+2=3,就真的是一个晴天和一个阴天在一起的时候就等于一个雨天吗?实际上是没有这种物理意义的,在或者说,猫标注为-1,狗标注为0,猪标注为1,难道一只猫和一直猪在一起的时候就等同于一只狗吗?
所以,在机器学习中,我们需要做数据离散化,比如晴天的时候是100,阴天的时候是010,下雨的时候是001,这样对于计算机来说是可识别的,而且对于实际来说也没有任何的物理意义。对于离散数据来说,分割的数量是2^N。
离散化分割数量
再比如说车速:
60 6570 75 80 85 90
这种连续行的数据也是需要做离散化的,因为如果不做离散化,每一个车速就等同于一个维度,那么对于一个跟速度有关的机器学习类算法中,你会有相当多的只是速度有关的维度,如果做了离散化,维度就会大大降低,比如:低速(60-75),中速(70-75),高速(80-90),这样维度就缩减了很多。对于连续数据来说,分割数量是N+1。
阅读全文
0 0
- 【机器学习】数据离散化
- 【学习】数据离散化
- 机器学习小组知识点27:数据预处理之数据离散化(Data Discretization)
- 机器学习 特征工程 特征离散化
- 机器学习读书笔记(三) 离散数据的生成模型
- 机器学习(七)使用pandas库进行数据分析_——统计信息和离散化
- 《数据挖掘导论》学习笔记-离散化
- 机器学习——连续型特征离散化
- 【机器学习】对于特征离散化,特征交叉,连续特征离散化非常经典的解释
- 机器学习: 离散变量的概率分布
- 数据的离散化
- 数据的离散化
- 数据的离散化
- 数据的离散化
- 数据离散化杂谈
- 数据离散化
- 数据离散化
- 数据的离散化
- Java生成UUID
- android studio 常见问题
- Codeforces894B-Ralph And His Magic Field
- Qt添加资源
- matlab函数汇总
- 【机器学习】数据离散化
- 选择排序和冒泡排序
- 欢迎使用CSDN-markdown编辑器
- 初次运行 Git 前的配置
- 8460
- 平衡树:treap学习笔记(3)
- 如何改变企业高管的数字转型理念
- 经典面试问题引发的一些想法
- MapReduce 与函数式编程