在套袋集成学习的情况下,当 max_sample=1.0 时 bootstrap=True 有什么意义吗?
Is there any meaning of having bootstrap=True, when max_sample=1.0 in case of bagging ensemble learning?
在套袋集成技术中,如果我使用 n_estimator=500
、max_sample=1.0
和 bootstrap=True
,那么它不等于 n_estimator=500
和 bootstrap=False
,在这两种情况下,只有 500 个训练实例中的一个样本会提供给我们的预测器?假设训练实例数=500。
不,这不等价。
当您指定 bootstrap=False
时,您基本上是在说您的每个弱估计器都应该使用训练集中的每个数据点进行一次训练。
当您指定 bootstrap=True
时,您正在使用替换绘图,这意味着某些数据点可能会被多次使用,而另一些则不会。 max_samples
只是一种确定您可以 bootstrap.
的数据部分的方法
在套袋集成技术中,如果我使用 n_estimator=500
、max_sample=1.0
和 bootstrap=True
,那么它不等于 n_estimator=500
和 bootstrap=False
,在这两种情况下,只有 500 个训练实例中的一个样本会提供给我们的预测器?假设训练实例数=500。
不,这不等价。
当您指定 bootstrap=False
时,您基本上是在说您的每个弱估计器都应该使用训练集中的每个数据点进行一次训练。
当您指定 bootstrap=True
时,您正在使用替换绘图,这意味着某些数据点可能会被多次使用,而另一些则不会。 max_samples
只是一种确定您可以 bootstrap.