程序博客网 > vscode markdown 预览

<机器学习>－－－决策树－－－补充

来源：互联网发布：vscode markdown 预览编辑：程序博客网时间：2024/06/07 00:38

本篇是在李航老师的《统计学习方法》的决策树基础上补充周志华老师的《机器学习》西瓜书的一点内容。

1.连续值处理：

当特征属性可取连续值的时候，就出现这个问题了。比如西瓜的含糖率，密度值这样的特征属性。

但其实，我们可以获取的样本，他们在连续属性上的取值都只是一个确定的值了。因此，假定17样本，就会有17个（或者小于17，因为可能取值相同了，这里就假使17个不同的a特征的取值），按照取值从小到大的顺序排序： a1 a2 a3 ......a17 。序列中间有16个间隔，每个间隔取一个值，这个值是两相邻值的平均值，例：a1 a2 之间取一个均值a12， a12作为a1 a2 的间隔值。依次类推，可得到16个新的a的特征取值，把这16个值作为a特征的所有可能取值，就可以和之前的离散特征取值一样生成决策树了。

2.对缺失值的处理：

缺失值是表示，获取的训练样本，的一些特征下的具体取值未知。如：

补救方法：

以色泽为例，为17 －3=14（即色泽那一列没有“—”的样本个数）

然后计算规则如下：

然后，处理缺失的特征值怎么归类：

一般wx是初始化为1的。

wx＊rv

多变量决策树。。。。没太看懂，明白后再来补充。。。欢迎指正！

阅读全文

1 0

vscode markdown 预览

vscode markdown 预览

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子脚起皮痒脚脱皮又痒止头痒头特别痒头痒有小疙瘩脚脱皮痒儿童头痒怎么办眼头痒头很痒头特别痒怎么办头一直痒脚痒起水泡头痒掉发用什么洗发水头痒是为什么头痒脱发是什么原因屁眼红痒头容易痒孩子头痒头痒有头皮屑怎么办腿上小红点痒头总是痒头痒脱发手指肿痒头皮痒头发掉头好痒怎么回事腿上红疙瘩痒屁眼湿痒头痒的原因洗完头后头皮痒头里面痒脚痒掉皮晚上脚痒头痒看什么科晚上脚痒怎么办头痒脱发用什么洗发水屁眼痒疼屁眼疼痒脸痒肿是怎么回事背痒屁股痒疼宝宝头痒怎么办