C4.5 算法
来源:互联网 发布:傲剑洗髓升级数据大全 编辑:程序博客网 时间:2024/06/07 21:10
C4.5 算法是机器学习算法中的一种分类决策树算法,其核心算法是 ID3 算法。
决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。
每个决策树可以依靠对源数据库的分割进行数据测试。这个过程可以递归式的对树进行修剪。 当不能再进行分割或一个单独的类可以被应用于某一分支时,递归过程就完成了。
C4.5算法核心思想是ID3算法,是ID3算法的改进,改进方面有:
1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;
2)在树构造过程中进行剪枝
3)能处理非离散的数据
4)能处理不完整的数据
C4.5算法优点:产生的分类规则易于理解,准确率较高。
缺点:
1)在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。
2)C4.5只适合于能够驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。
阅读全文
1 0
- C4.5算法
- C4.5决策树算法
- C4.5算法
- c4.5算法
- C4.5决策树算法
- C4.5算法
- C4.5算法概要
- C4.5算法
- C4.5算法
- C4.5决策树算法
- C4.5算法
- C4.5算法
- C4.5算法笔记
- C4.5算法
- 决策树-C4.5算法
- C4.5决策树算法
- C4.5算法
- 决策树【C4.5算法】
- 人工智能目标跟踪小车
- 查看 Android 源码版本
- 162. Find Peak Element
- php 生成邀请码
- C语言宏替换
- C4.5 算法
- spring是什么及如何在spring中添加事务
- 虚拟机linux挂载光盘显示:mount: you must specify the filesystem type
- struts2.0 上传文件
- codeforces contest 868 problem D(玄学)
- tensorflow(2)
- Hello World!
- C++PRIMER第三章课后练习
- BZOJ2330 差分约束之浅谈数学不等式拓扑逻辑顺序转化为图论中队列实现广度优先搜索的最长路之双端队列Bellman-Ford算法及入队次数判断自环