决策树的创建过程
来源:互联网 发布:sql group by 多列 编辑:程序博客网 时间:2024/05/22 15:18
创建过程是先横向寻找维度,再在该维度上按特征值切割。具体过程如下:
数据集的特征
dataset=[[1,1,yes],
[1,1,yes],
[1,0,no],
[0,1,no],
[0,1,no]],
数据集最后一列是分类标签。
首先输入数据集,提取出类标签列表,如果该列表只有一类,则直接返回类标签,如果数据集只有一列,则返回类别数最大的类标签。先横向尝试在不同维度上按最佳信息增益的方法,找出用哪一维度的数据分割最好,然后取出该维度标签,构造决策树;继而通过去重提取该维度的特征值,有多少个特征值即该维度标签下就有多少条分支,接着按该维度的特征值对数据集进行切割,切割后的数据集在横向上缺少了该维度,在纵向上只包含该特征值的行,对切割后的数据集,作为新的数据集传入重复上面的过程,直到所有分支构建完毕。
1 1
- 决策树的创建过程
- 决策树的训练过程
- 决策树的创建
- 基于单层决策树的 AdaBoost的训练及测试过程
- [MoonML]-决策树C45的计算过程和其中的疑问
- 窗体创建的过程
- 工具条的创建过程
- 创建虚拟机的过程
- Hibernate的创建过程
- 对象的创建过程
- 进程的创建过程
- XMLHttpRequest的创建过程
- 对象的创建过程
- 创建mediaserver的过程
- 对象的创建过程
- 存储过程的创建
- 创建窗口的过程
- 储存过程 的 创建
- 常用的网络
- 过零丁洋
- 无题
- 常用的网络传输协议
- 解決Mac系統下"don't have permission to see its contents"問題
- 决策树的创建过程
- Head_First_Python学习笔记(一)
- 水果列表
- LeetCode Minimum Size Subarray Sum
- Libgdx 之贝塞尔曲线
- 一种离散数学中求传递闭包的算法实现
- android-BroadcastReceiver
- Libgdx 之资源加密保护
- 安卓-新浪微博评论