如何向高管证明预测模型的可靠性?

How to prove the reliability of a predictive model to executives?

我训练了 500 台设备的数据来预测它们的性能。然后,我将经过训练的模型应用于另外 500 台设备的测试数据集,并显示出相当不错的预测结果。现在我的主管要我证明这个模型可以在 100 万台设备上运行良好,而不仅仅是 500 台。显然我们没有 100 万台设备的数据。如果模型不可靠,他们希望我发现所需的训练数据量,以便在一百万台设备上做出可靠的预测。我应该如何与这些没有统计分析和建模背景的高管打交道?有什么建议么?谢谢

我已建议@cep 将他的评论写下来作为答案 - 包括提供 variancebias 计算。无论如何都可以添加

"Do not be quick to assume Execs are essentially incapable in terms of technical or mathematical concepts"

虽然那里可能有 Dilbert 经理.. 某处 我自己很少见到他们。更多的时候,管理者是通过努力工作到达他们的位置的。它们可能会生锈 - 但功能可能仍然存在。

在这种情况下,无论他们是否"background in statistical analysis and modeling"他们都在运用常识。

您可能做的第一件事是提供适当的上下文和术语。 @cel 提到了其中的一些:为 :

提供具体值
  • 假设
    • 您对数据做了哪些假设。
    • 有限的数据有什么依据可以考虑外推
    • 为什么应该相信外推结果适用于 99.5% 的未测试数据
  • 数据分布
    • 基本描述性统计
    • 您对数据的先验分布的看法。证明你选择它的理由
  • 建模
    • 考虑了哪些 models/approaches 以及为什么
    • 您实际选择了哪个型号以及为什么
    • 你是如何得出超参数的
    • 你是如何训练模型的
  • 结果
    • 拟合和错误率的统计测量