H2O 中的平均残差公式

Mean Residual Deviance Formula in H2O

我正在尝试找出 H2O 中用于 Tweedie 分布的平均残差损失函数的确切公式。

或者甚至,一般来说,Tweedie 分布因变量的平均残差是多少?

到目前为止,我找到了这个页面 (http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/glm.html#tweedie-models),其中给出了 tweedie 分布的偏差公式:

然而,在 H2O 代码中,在本页第 103 行 (github) (https://github.com/h2oai/h2o-3/blob/master/h2o-core/src/main/java/hex/Distribution.java#L103) 中,公式指定不同(忽略 omega,它只是重量,缺少求和):

2 * w * (Math.pow(y, 2 - tweediePower) / ((1 - tweediePower) * (2 - tweediePower)) - y * exp(f * (1 - tweediePower)) / (1 - tweediePower) + exp(f * (2 - tweediePower)) / (2 - tweediePower))

方程形式为:

所以,是文档错误还是实现错误?如果有任何帮助,我将不胜感激!

谢谢!

感谢您指出这一点,而后端方程位于 here is correct (so the implementation is correct), the equation in the documentation appears to be incorrect. I have created this Jira ticket 以更新文档中的方程。门票包含正确的方程式以及有用的信息来推导它。