找出 R H2O AutoML 模型中贡献最大的 variables/features？

Question

我目前正在使用一些保险数据来预测客户的保险金额 class。为了实现这一点，我在 R 中使用了 H2O 包的 AutoML 函数。现在我有了我的模型，我希望能够看到我的数据中哪个 variables/features 对模型做出的预测贡献最大. H2O 这样的事情可能吗？如果没有，用 R 实现这一目标的另一个好选择是什么？谢谢！

Answer 1

绝对有可能。如果 AutoML 选择的最佳拟合模型不是整体模型，那么您可以使用以下内容绘制变量重要性（其中模型是您从 AutoML 中提取的 model），

library(h2o)
h2o.varimp_plot(model)

如果最合适的模型是一个整体，那么事情会稍微复杂一些。一个不错的选择是使用 lime 包来查看局部重要性。

 library(h2o)
 library(lime)

 ## Train explainer
 explainer <- lime(train, model)

 ## Get explanations for a subset of samples
 explanation <- explain(train[1:5, ], explainer, n_features = 10)

 ## Plot global explanations
 plot_explanations(explanation)

 ## Plot local explanations
 plot_features(explanation)

找出 R H2O AutoML 模型中贡献最大的 variables/features？

Find out the most contributing variables/features of an R H2O AutoML model?

r

variables

h2o