LightGBM 中的 Bagging 是如何工作的

How Bagging in LightGBM works

在lightGBM模型中,与bagging相关的参数有2个

bagging_fraction
bagging_freq (frequency for bagging
              0 means disable bagging; k means perform bagging at every k 
              iteration
              Note: to enable bagging, bagging_fraction should be set to 
              value smaller than 1.0 as well)

我可以在 gdbt 中找到关于这个 bagging 函数的更详细的解释。那么有没有人给我更详细的解释呢?

该代码执行文档所说的内容 - 它对大小为 bagging_fraction * N_train_examples 的训练示例的子集进行采样。并且在该子集上执行第 i 棵树的训练。可以对每棵树(即每次迭代)或在每棵 bagging_freq 树都经过训练后进行这种采样。

例如,bagging_fraction=0.5, bagging_freq=10 表示每 10 次迭代将对新的 0.5*N_train_examples 条目进行采样