使用标准 MAE 而不是 MSE 的 scikit-learn 中的随机森林回归速度慢了约 150 倍

Random Forest Regression in scikit-learn with criterion MAE instead of MSE is ~150 times slower

我正在尝试使用具有 criterion = mae(平均绝对误差)而不是 mse(均方误差)的随机森林回归。

对计算时间影响很大

大约需要 6 分钟mae)而不是 2.5 秒mse) .大约慢 150 倍。

为什么?

如何减少计算时间?

P.S。决策树也有类似的情况。 差异不大,但每棵树的比例大致相同。

这是一个众所周知的问题。参见 here and here

长话短说:

  • with mae,更新损失需要 O(n)
  • mse,更新损失需要O(1)