如何获得 XGBClassifier 的预测 p 值?
How to get prediction p-values of an XGBClassifier?
我想知道 XGBClassifier 对它所做的每个预测有多自信。有可能有这样的价值吗?还是 predict_proba 已经间接地建立了模型的置信度?
您的直觉确实是正确的:predict_proba
returns 每个示例属于给定 class 的概率;来自 docs:
predict_proba
(data, output_margin=False, ntree_limit=0)
Predict the probability of each data example being of a given class.
这个概率反过来被例行解释在实践中作为预测的置信度。
也就是说,这是一种临时的、实用的解释,与 p 值或任何其他统计严谨性度量无关;一般来说和 AFAIK,这种(和类似的)机器学习技术没有这样的措施。
在更一般的层面上,您可能有兴趣知道 p 值本身在统计学家中已经迅速失宠;一些快速链接:
The ASA's Statement on p-Values: Context, Process, and Purpose(美国统计学家)
-
The problems with p-values are not just with p-values(Andrew Gelman @ 美国统计学家)
The problem with p-values(迈向数据科学博客 post)
我想知道 XGBClassifier 对它所做的每个预测有多自信。有可能有这样的价值吗?还是 predict_proba 已经间接地建立了模型的置信度?
您的直觉确实是正确的:predict_proba
returns 每个示例属于给定 class 的概率;来自 docs:
predict_proba
(data, output_margin=False, ntree_limit=0)Predict the probability of each data example being of a given class.
这个概率反过来被例行解释在实践中作为预测的置信度。
也就是说,这是一种临时的、实用的解释,与 p 值或任何其他统计严谨性度量无关;一般来说和 AFAIK,这种(和类似的)机器学习技术没有这样的措施。
在更一般的层面上,您可能有兴趣知道 p 值本身在统计学家中已经迅速失宠;一些快速链接:
The ASA's Statement on p-Values: Context, Process, and Purpose(美国统计学家)
The problems with p-values are not just with p-values(Andrew Gelman @ 美国统计学家)
The problem with p-values(迈向数据科学博客 post)