Python SkLearn 梯度提升分类器 Sample_Weight 澄清

Python SkLearn Gradient Boost Classifier Sample_Weight Clarification

使用Python SkLearn 梯度提升分类器。我使用的设置是 selecting 随机样本（随机）。对其中一个二进制 classes（结果 = 0）使用 1 的 sample_weight，对另一个 class（结果 = 1）使用 20。我的问题是如何在 'laymans terms' 中应用这些权重。

是不是在每次迭代中，模型将 select 来自样本的 x 行用于 0 个结果，y 行用于 1 个结果，然后 sample_weight 设置将启动并保留所有 x，但对 y (1) 结果进行 20 倍的过采样？

在文档中，我不清楚 sample_weight > 1 是否是过采样。我知道 class_weight 是不同的，不会更改数据，但模型如何解释数据损失函数。 Sample_weight另一方面，它是否真的通过过采样有效地改变了输入模型的数据？

谢谢

样本权重是乘数，这里是代码：

https://github.com/scikit-learn/scikit-learn/blob/f0ab589f/sklearn/ensemble/gradient_boosting.py#L1225

Python SkLearn 梯度提升分类器 Sample_Weight 澄清

Python SkLearn Gradient Boost Classifier Sample_Weight Clarification

python

gradient

scikit-learn

boosting