机器学习实战+第三章_决策树

来源:互联网 发布:read修复软件 编辑:程序博客网 时间:2024/05/16 10:57

 本章采用的是ID3算法。通过计算香农熵来确定最佳特征(bestFeature),再通过最佳特征将树划分成子树,递归的调用createTree函数。

优缺点:

可视化非常好

无法处理数值型数据

可能出现过度匹配的现象,可以通过剪枝了缓解

注明:

书里面的代码时用的python2,我是3.6版本,所以有些地方会有出入。

其次,关于treePlotter模块,xOff和偏移量的公式我进行了修正,使它更易于理解。



0 0
原创粉丝点击