强制分类器 select 固定数量的目标
Force classifer to select a fixed number of targets
如果我有一个包含事件的数据集,其中每个事件都有包含 1000 个可能项目的数据,每个事件只有 100 个是正确的。我如何强制我的分类器 select 每个事件只有 100?
在我 运行 它通过我的训练模型(具有 18 个特征并且总是有 100 个 targets/event 标记为 1)之后,分类器 selects 在 60-80 个项目之间的任何地方而不是100. 即使我给每个事件一个事件编号也无济于事。
我正在使用 python sklearn 梯度提升和随机森林方法。
自己动手吧。 scikit-learn 中的每个分类器都允许您访问 decision_function 或 predict_proba,它们都支持预测操作(预测只是这些的 argmax)。因此 - 只有 select 100 个获得最高支持。
如果我有一个包含事件的数据集,其中每个事件都有包含 1000 个可能项目的数据,每个事件只有 100 个是正确的。我如何强制我的分类器 select 每个事件只有 100?
在我 运行 它通过我的训练模型(具有 18 个特征并且总是有 100 个 targets/event 标记为 1)之后,分类器 selects 在 60-80 个项目之间的任何地方而不是100. 即使我给每个事件一个事件编号也无济于事。
我正在使用 python sklearn 梯度提升和随机森林方法。
自己动手吧。 scikit-learn 中的每个分类器都允许您访问 decision_function 或 predict_proba,它们都支持预测操作(预测只是这些的 argmax)。因此 - 只有 select 100 个获得最高支持。