Python SkLearn 梯度提升分类器 Sample_Weight 澄清
Python SkLearn Gradient Boost Classifier Sample_Weight Clarification
使用Python SkLearn 梯度提升分类器。我使用的设置是 selecting 随机样本(随机)。对其中一个二进制 classes(结果 = 0)使用 1 的 sample_weight,对另一个 class(结果 = 1)使用 20。我的问题是如何在 'laymans terms' 中应用这些权重。
是不是在每次迭代中,模型将 select 来自样本的 x 行用于 0 个结果,y 行用于 1 个结果,然后 sample_weight 设置将启动并保留所有 x,但对 y (1) 结果进行 20 倍的过采样?
在文档中,我不清楚 sample_weight > 1 是否是过采样。我知道 class_weight 是不同的,不会更改数据,但模型如何解释数据损失函数。 Sample_weight另一方面,它是否真的通过过采样有效地改变了输入模型的数据?
谢谢
使用Python SkLearn 梯度提升分类器。我使用的设置是 selecting 随机样本(随机)。对其中一个二进制 classes(结果 = 0)使用 1 的 sample_weight,对另一个 class(结果 = 1)使用 20。我的问题是如何在 'laymans terms' 中应用这些权重。
是不是在每次迭代中,模型将 select 来自样本的 x 行用于 0 个结果,y 行用于 1 个结果,然后 sample_weight 设置将启动并保留所有 x,但对 y (1) 结果进行 20 倍的过采样?
在文档中,我不清楚 sample_weight > 1 是否是过采样。我知道 class_weight 是不同的,不会更改数据,但模型如何解释数据损失函数。 Sample_weight另一方面,它是否真的通过过采样有效地改变了输入模型的数据?
谢谢