C4.5算法的理解
来源:互联网 发布:christopher bu知乎 编辑:程序博客网 时间:2024/06/08 02:13
C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:
1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;
2) 在树构造过程中进行剪枝;
剪枝为了处理由于数据中的噪声和离群点导致的过分拟合问题。剪枝有两种:
先剪枝——在构造过程中,当某个节点满足剪枝条件,则直接停止此分支的构造。
后剪枝——先构造完成完整的决策树,再通过某些条件遍历树进行剪枝。
3) 能够完成对连续属性的离散化处理;
4) 能够对不完整数据进行处理。
C4.5算法有如下优点:产生的分类规则易于理解,准确率较高。
其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。此外,C4.5只适合于能够驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。
阅读全文
0 0
- C4.5算法的理解
- 数据挖掘算法【一】c4.5算法的理解
- c4.5的参数理解
- C4.5算法的分析和实现
- 决策树之C4.5的生成算法
- C4.5算法的分析和实现
- C4.5算法
- C4.5决策树算法
- C4.5算法
- c4.5算法
- C4.5决策树算法
- C4.5算法
- C4.5算法概要
- C4.5算法
- C4.5算法
- C4.5决策树算法
- C4.5算法
- C4.5算法
- 我的微信好友
- 【Cousera作业】魔兽世界之一:备战
- [WPF] 如何调试Data Binding
- 编译错误 无法打开包括文件:“SDKDDKVer.h”: No such file or directory
- 【09】一个程序员的简洁职业生涯规划
- C4.5算法的理解
- 20170908_TCP的短连接和长连接
- Qt 正则匹配
- 一个线程安全的std::map封装
- for表达式的语句执行顺序?
- 基于Android Studio的Android内存泄漏检测方法
- JavaScript窗口
- C++中堆和栈的介绍
- python爬虫