h2o.predict() 在新测试集上使用哪个阈值?

Which threshold does h2o.predict() use on new testing set?

我在这里阅读了几个关于 h2o.predict() 和 h2o.performance() 差异的帖子(如下面的 link 所示)。

谁能告诉我 h2o.predict() 使用的是哪个阈值?是max f1吗?如果是,是来自训练数据、验证数据还是交叉验证的阈值?

我尝试在测试集上使用 max f1max f0point5 来使用验证阈值(完全独立于训练和验证数据),但是 class 来自 h2o.predict() 和使用阈值的 class 不完全匹配。

我得到的最接近的是使用 max f0point5 训练中的阈值并将其应用于测试集。

关于 h2o.predict 的文档不多。另外,是否有阈值的最佳实践,即验证和训练的平均阈值等?

提前致谢!

以下是用户运行 h2o.predict().predict() 时如何选择预测阈值的具体信息:

1) 如果您仅使用训练数据训练模型 - 使用训练数据模型指标中的最大 F1 阈值。

2) 如果您使用训练数据和验证数据训练模型 - 使用验证数据模型指标中的最大 F1 阈值。

3) 如果您使用训练数据训练模型并设置 nfold 参数 - 使用训练数据模型指标中的最大 F1 阈值。

4) 如果您使用训练数据、验证数据训练模型并设置 nfold 参数 - 使用验证数据模型指标中的最大 F1 阈值。