H2o 流量,是否可以解释个人预测?

H2o flow, is it possible to explain individual predictions?

我是 H2o flow 的新用户。不是一个编码员,所以我喜欢点击界面。我想知道在构建模型并使用它对数据集进行评分之后,是否有任何方法可以生成输出来告诉我每条记录的分数是它的原因。

例如,我创建了一个模型,使用流中的 autoML 功能预测再次入院的风险。

它实际上非常有效,但当我使用它时,我会将排名靠前的患者发送给临床人员,他们想知道 "why was this person highly ranked"。

有什么方法可以显示模型中的哪些变量导致对每个人的预测作为输出,我可以将其导出到数据库以用于报告工具?

谢谢!

您的问题与机器学习可解释性技术有关。在 H2O-3 中,两个可用的是:variable importance plot (which tells you which features have the greatest impact on the models decisions) and Partial Dependence Plots,它让您了解单个特征(也称为列或变量)如何影响模型的平均预测。

有关可用机器学习可解释性技术的概述,我建议您查看 H2O.ai 的 MLI booklet(但请注意,这些技术在大多数情况下仅提供在不同的产品中——所以如果你想使用它们,你必须自己编写技术代码)。