C4.5算法的流程和程序分析
来源:互联网 发布:虹吸壶 知乎 编辑:程序博客网 时间:2024/06/07 17:27
C4.5算法是一种较成熟的异常检测算法,如果学习这个算法,只需要学习怎么使用它既可。
C4.5程序分析
1. 使用方法
1)C45 –f golf (golf.data为数据文件名 ),生成golf.tree文件,即只创建树。
2)C45 –u golf(golf.data为数据文件名),除生成golf.tree文件,还使用evaluate方法进行完整性检测,生成正确率和错误率,并且生成预测类。
2. 算法流程
1)输入接口
获取相应的一些参数
2) 参数
-f :为FileName赋值,以进行读文件操作
-u :除了有-f的所有功能外,又增加了为UNSEENS赋值的功能,目的是对读取的数据进行检测并预测。
3)输出接口
Evaluate(CMInfo,Saved)方法在besttree.c文件中……………
GetData_unabled(”.unlabled”),其作用是集外测试正确率,”.unlabled”为自行创建的数据集。(因为C45是狂揉的,及时输入和输出没有任何关系,决策树一样可以给出很不错的决策正确率,尤其是集内测试正确率)
总结:对使用者来说,最重要的是知道C4.5算法的输入数据格式,假设所要研究的项目的名称是a,则对于C4.5训练而言就之至少需要a.nam和a.dat,其中a.name是输入数据的格式,而a.dat则是严格按照这种格式所生成的输入数据文件。a.unlabled文件格式和a.dat完全一样,但理论上数据应该是不一样的,因为一个是训练数据,一个是用于测试开放正确率。
0 0
- C4.5算法的流程和程序分析
- C4.5算法的分析和实现
- C4.5算法的分析和实现
- ID3和C4.5算法
- C4.5算法的理解
- 分析ID3算法和C4.5算法,并分析J48源码结构
- 三个有名的决策树算法:CHAID、CART和C4.5
- 【ML笔记】决策树ID3和C4.5算法的异同
- 整理--决策树算法:ID3和C4.5
- 整理--决策树算法:ID3和C4.5
- 决策树算法:ID3和C4.5
- ID3和C4.5决策树算法总结
- 决策树之C4.5的生成算法
- 决策树理论、C4.5源码分析及AdaBoost算法的提升改造
- c4.5代码分析
- C4.5决策树分析
- C4.5算法
- C4.5决策树算法
- (转)几种流形学习算法
- 面试题
- tomcat生成秘钥的方法
- 书读百遍,其义自现
- 简单编程(十)搬砖问题
- C4.5算法的流程和程序分析
- 过山车(杭电2063)
- bluedroid discover 超时设置
- 派生类和基类指针的一些使用方法
- 五子棋----1
- 研发团队管理之一:团队成员管理
- NVL,NVL2,NULLIF,COALESCE
- Ubuntu14.04下安装Hadoop2.4.0 (单机模式)
- Codeforces Round #275 (Div. 2)B——Friends and Presents