Machine Learning with Scikit-Learn and Tensorflow 7.6 Extra-Trees

来源:互联网 发布:免费库存记账软件 编辑:程序博客网 时间:2024/05/19 02:04

书籍信息
Hands-On Machine Learning with Scikit-Learn and Tensorflow
出版社: O’Reilly Media, Inc, USA
平装: 566页
语种: 英语
ISBN: 1491962291
条形码: 9781491962299
商品尺寸: 18 x 2.9 x 23.3 cm
ASIN: 1491962291

系列博文为书籍中文翻译
代码以及数据下载:https://github.com/ageron/handson-ml

当训练随机森林的决策树时,我们从部分特征中寻找最优的特征。事实上,我们也能尝试在此基础上使用随机的阈值分割当前特征,而不是寻找最优的阈值,这是Extra-Trees(Extremely Randomized Trees)的基本思想。这样的思想再次增加偏差,减少方差。通常,Extra-Trees训练速度优于随机森林,因为寻找最优的阈值是决策树训练耗时的部分。

我们可以利用scikit-learn提供的ExtraTreesClassifier/ExtraTreesRegressor实现上面的思想。这些API的参数和RandomForestClassifier/RandomForestRegressor相同。

注释:
我们难以事先得知ExtraTreesClassifier/ExtraTreesRegressor和RandomForestClassifier/RandomForestRegressor的效果孰优孰劣。常用的方法是分别加以尝试,使用grid search寻找最优的参数并且使用交叉验证获得模型的效果。

0 0
原创粉丝点击