weka logitboost
来源:互联网 发布:大数据培训北京海淀区 编辑:程序博客网 时间:2024/05/16 01:05
最近在使用weka,一个机器学习领域的开源项目,可以对输入的数据进行分类,聚类等。使用它自带的logit boost进行分类。发现对数据分类的效果不错。使用的测试模型选项是10-折叠交叉验证。后来,阅读它的文档,了解了执行该算法的一些参数。其中有一个参数为 -F<number> 。这个参数是设置折叠数目,并且默认情况为0。 一下子不知道是怎么回事了。怎么参数里面有k-折叠交叉验证, 同时测试模型选项中也有k-折叠交叉验证。这是怎么回事?
深入到它的源代码,它确实使用了参数中的折叠数目。后来仔细想了一下,得出的结论如下;
参数中的k-折叠交叉验证在logitboost算法中又称为内部k-折叠交叉验证。主要用它来选择logitboost算法中的最佳迭代次数的。每一次迭代将会产生一个模型,利用k-折叠交叉验证获得该模型的性能指标。这样就可以从很多次迭代中选择最优的迭代次数。而默认是不执行的,并且直接设最佳迭代次数为10. 有了最佳迭代次数,然后将数据应用于该模型,使用我们理解的10-折叠交叉验证来验证算法。以最终结果来判断该模型的好坏。
还有一个问题,当我设置weka内部的折叠次数为1,2,或其它时,weka就无法生成分类器了。不知道是为什么?没有深度分析weka内部的代码。有知道原因的吗?
- weka logitboost
- LogitBoost学习
- weka
- weka
- WEKA
- Weka
- weka
- Weka
- WEKA
- weka
- weka
- Discrete AdaBoost,Real AdaBoost,LogitBoost AdaBoost,Gentle AdaBoost
- weka基础:weka.core
- Hello, Weka
- weka数据库连接
- Weka Dataset
- weka入门教程
- weka入门
- android实现界面左右滑动(GridView动态设置item,支持每个item按某个属性排序来显示在不同的界面)
- ibaties sqlmap
- LCD控制器与帧率、刷新率的关系分析
- 除去淘宝在全球“恶名市场”年度名单
- 部署项目到weblogic中出现 The error is weblogic.descriptor.DescriptorException: Unmarshaller failed
- weka logitboost
- uri 基础知识
- 第18节 静态属性与方法
- 博客搬家,搬博客
- 输错三次禁止登陆,15分钟后才能继续。用数据库记录ErrorTimes,最后出错时间lastErrorDateTime。
- Understanding H.264 num_units_in_tick and time_scale
- spring redis整合
- MyEclipse与WebLogic9.2的集成方法
- IE6下z-index犯癫不起作用bug的初步研究