R h2o.deeplearning 以分类方式获取概率

R h2o.deeplearning obtaining probabilities with classification mode

我正在使用 h2o.deeplearning 在分类任务上训练神经网络。

我有什么

Y ~ x1 + x2... 其中所有 x 变量都是连续的,Y 是二进制的。

我想要什么

能够训练深度学习对象来预测给定行为真或假的概率。也就是说,predicted(Y) 限制在 0 和 1 之间。

我试过的 当 Y 作为数字输入(即 0 或 1)时,h2o deeplearning 会自动将其视为回归问题。这很好,除了 NN 的最后一层是线性的,而不是 tanh,并且预测值可以大于 1 或小于 0。我一直没能找到让最后一层成为 tanh 的方法.

当 Y 输入为分类(即 TRUE 或 FALSE)时,h2o deeplearning 会自动将其视为分类问题。它没有给我期望的 Y 为 1 或 0 的概率,而是给了我对 Y 是什么的最佳猜测。

有办法解决这个问题吗?技巧、调整或被忽视的参数?我注意到 h2o.deeplearning 文档中有一个 'distribution' 参数,但没有关于它的用途的更多信息。我最好的猜测是它是某种与 GLM 类似的 link 函数,但我不确定。

如果您将问题视为二进制 class化问题,那么您不仅会得到 0 或 1 的“预测”,还会得到加起来为 1 的 p0 和 p1 概率。这些是预测值分别为负值和正值的概率 class。

那就直接用p1吧