二叉搜索树修改
来源:互联网 发布:知画怀有乾隆的孩子 编辑:程序博客网 时间:2024/06/05 08:10
如果有一个方法,每迭代一步都能从数据中选出一部分“高纯度”的特定类,
那么即使每步只能分别出1%的类别,只需100步即可完成漂亮的分类规则。
ID3算法、C4.5等算法使用熵作为评价标准,导致一个问题:树细分到一个样本一个节点,熵为0。
为应付这个情况,通常选择固定子树数量上限等方法。
相对应的,cart树直接定义为二叉树,保证了每次划分的结果是,从总体而言把不同类尽可能分开。
如果说每次选出部分小类是“捡芝麻”,那么目前的算法可以算是“切西瓜”
然而,我觉得“捡芝麻”也是可以考虑到,尤其是树结构最后是由叶节点类别是投票选择的,满足了大部分“选民”,牺牲了小部分。
但如果可以在算法过程及时考虑“少数者”,尽早将其划分出,那么剩余的数据所生成的树,将有更高“纯度”的叶节点
具体的,当划分满足以下简单的要求:所划分出的部分有足够的数目、纯度。则在该阶段直接生出一个预测类别的叶节点。
0 0
- 二叉搜索树修改
- 【二叉搜索数】HDU3791二叉搜索树
- 二叉树--二叉搜索树
- 【二叉树】二叉搜索树
- 二叉树- 二叉搜索树
- 【搜索树】二叉搜索树
- 二叉搜索树BSTree
- 二叉搜索树
- 二叉搜索树
- 二叉搜索树
- 最优二叉搜索树
- 二叉搜索树
- 二叉搜索树
- HDOJ3791 二叉搜索树
- 二叉查找树搜索
- 二叉搜索树
- 二叉搜索树
- BST 二叉搜索树
- Android Studio调试功能使用总结
- Vijos1008 篝火晚会
- 第一个Python程序
- 日经春秋 20150812
- c#委托
- 二叉搜索树修改
- Android Studio系列教程3--快捷键
- 上传网页时,中文乱码问题
- DPM(Deformable Parts Model)--原理(一)
- 【黑马程序员-学习笔记】OC-Runtime
- IOS:将JSONMdel中的枚举类型转换为字符串(如果你想,当然也可以是任何你想要的数据类型)
- Eclipse使用Tips
- 一个页面创建多个tableView 相关联(省市区数组)
- 调度台启动流程