h2o.splitFrame 是否考虑了多项 class 化的 class 比例?

Does h2o.splitFrame account for class proportion for multinomial classification?

h2o.splitFrame 是否考虑了 class 多项式 class 化的比例?例如,如果我的原始数据集有三个 class 的比例分别为 20%、70% 和 10%,当我创建训练、有效和测试数据集时,它们是否具有相似的 class 比例?

感谢您的意见!

不,不是。

它进行最简单的随机拆分,使用 "coin flip" 逐行独立处理每一行。

思路是,既然H2O-3是用来处理大数据的,样本够多,不用担心。