H2O 导入文件跳过行

H2O importFile skiping rows

如何在导入文件时跳过行??跳过不是 h2o.importFile 命令的可用选项。

我使用了库 h2o 和命令:

h2o.importFile()

h2o.importFile() 函数不提供在导入时跳过行的方法。您有几个选择:

  1. 使用 h2o.importFile() 导入,然后将框架子集化为您想要的行。以下是 some examples 如何在 H2OFrame 中分割行。
  2. 使用不同的包导入,这将允许您跳过行,然后使用 as.h2o() 将数据从 data.frame 转换为 H2OFrame。如上面的评论所述,as.h2o() 函数对于大数据集可能会很慢,但是,您可以通过安装 data.table 包并设置 options("h2o.use.data.table" = TRUE).

我推荐第一个选项,但您可以同时尝试这两个选项,看看哪个选项对您的数据集来说更快。