max_bin参数如何影响LightGBM的速度和过拟合?
How does max_bin param affect the speed and overfitting of LightGBM?
这是来自 lightgbm 文档
但是我还是不明白什么是bin?以及它如何影响 lightgbm 的性能?
LightGBM 的一个关键部分是它在构建树时将连续特征分箱到 bins/buckets(如直方图),这减少了内存使用并大大加快了训练时间。请参阅文档的第 4.1 节,here。
XGBoost 现在也将此作为一个选项实现,它允许与 LightGBM 类似的训练速度,并且可以使用 tree_method='hist'
.
来实现
我最近使用 max_bin
(max_bin: 500
) 的经验是它在 GPU 模式下出现问题。所以当 运行 在 GPU 模式下我跳过这个参数。
我看到文档说使用 63
,为什么不使用 64
?在没有 运行 GPU 模式问题的情况下,我们可以使用的最高值是多少?
这是来自 lightgbm 文档
LightGBM 的一个关键部分是它在构建树时将连续特征分箱到 bins/buckets(如直方图),这减少了内存使用并大大加快了训练时间。请参阅文档的第 4.1 节,here。
XGBoost 现在也将此作为一个选项实现,它允许与 LightGBM 类似的训练速度,并且可以使用 tree_method='hist'
.
我最近使用 max_bin
(max_bin: 500
) 的经验是它在 GPU 模式下出现问题。所以当 运行 在 GPU 模式下我跳过这个参数。
我看到文档说使用 63
,为什么不使用 64
?在没有 运行 GPU 模式问题的情况下,我们可以使用的最高值是多少?