https://www.cnblogs.com/sylz/p/6858544.html?utm_source=itdadao&utm_medium=referral

来源:互联网 发布:国外数据新闻报道 编辑:程序博客网 时间:2024/05/01 14:38
Bagging Classifier+Regressor

from sklearn.ensemble import BaggingRegressor

Bagging通过引入随机化增大每个估计器之间的差异。



参数介绍:
  • base_estimator:Object or None。None代表默认是DecisionTree,Object可以指定基估计器(base estimator)。
  • n_estimators:int, optional (default=10) 。   要集成的基估计器的个数。    
  •  max_samples: int or float, optional (default=1.0)。决定从x_train抽取去训练基估计器的样本数量。int 代表抽取数量,float代表抽取比例   
  • max_features : int or float, optional (default=1.0)。决定从x_train抽取去训练基估计器的特征数量。int 代表抽取数量,float代表抽取比例
  • bootstrap : boolean, optional (default=True) 决定样本子集的抽样方式(有放回和不放回)
  • bootstrap_features : boolean, optional (default=False)决定特征子集的抽样方式(有放回和不放回)
  • oob_score : bool 决定是否使用包外估计(out of bag estimate)泛化误差
  • warm_start : bool, optional (default=False) true代表
  • n_jobs : int, optional (default=1)   
    random_state : int, RandomState instance or None, optional (default=None)。如果int,random_state是随机数生成器使用的种子; 如果RandomState的实例,random_state是随机数生成器; 如果None,则随机数生成器是由np.random使用的RandomState实例。

    verbose : int, optional (default=0)

属性介绍:

    estimators_ : list of estimators。The collection of fitted sub-estimators.

    estimators_samples_ : list of arrays

    estimators_features_ : list of arrays

    oob_score_ : float,使用包外估计这个训练数据集的得分。

    oob_prediction_ : array of shape = [n_samples]。在训练集上用out-of-bag估计计算的预测。 如果n_estimator很小,则可能在抽样过程中数据点不会被忽略。 在这种情况下,oob_prediction_可能包含NaN。

还要解决三个问题

①他到底是什么,用于什么情况?

  BaggingRegressor就是一个Bagging的回归器组合。说到底还是用于集成多个回归器,所以还是会勇于回归预测的情况,集成一下解决过拟合的问题。

②他的优缺点?

  

③调参过程?
阅读全文
0 0
原创粉丝点击