如何确定分类模型中的阈值?

How to decide threshold in classification model?

假设我构建了一个 class化模型,然后为了改进,比方说,精度,我只是增加了更高 class 的阈值概率。这有意义吗?我没有改变模型,只是改变阈值概率以获得更好的答案。可以吗?谢谢

这是完全可以接受的,事实上这就是我们拥有 ROC 曲线和精确召回曲线的原因之一。

更改阈值称为参数调整,是一种常见做法。

参数调优,比如根据你的数据设置一个阈值,完全没问题。

但是,请记住,您应该对数据进行 train-test 拆分。训练数据用于计算你的参数,测试数据应该只在最后使用一次,当你想计算你的算法的性能时。如果你需要两个数据集来计算你的参数(例如,一些参数,然后是阈值的另一个数据集),然后再次拆分你的训练数据集(现在你有训练,验证和test-data)。