h2o.splitFrame 是否考虑了多项 class 化的 class 比例?
Does h2o.splitFrame account for class proportion for multinomial classification?
h2o.splitFrame 是否考虑了 class 多项式 class 化的比例?例如,如果我的原始数据集有三个 class 的比例分别为 20%、70% 和 10%,当我创建训练、有效和测试数据集时,它们是否具有相似的 class 比例?
感谢您的意见!
不,不是。
它进行最简单的随机拆分,使用 "coin flip" 逐行独立处理每一行。
思路是,既然H2O-3是用来处理大数据的,样本够多,不用担心。
h2o.splitFrame 是否考虑了 class 多项式 class 化的比例?例如,如果我的原始数据集有三个 class 的比例分别为 20%、70% 和 10%,当我创建训练、有效和测试数据集时,它们是否具有相似的 class 比例?
感谢您的意见!
不,不是。
它进行最简单的随机拆分,使用 "coin flip" 逐行独立处理每一行。
思路是,既然H2O-3是用来处理大数据的,样本够多,不用担心。