如何正确地将数据导入 R 中的 h2o 客户端?

How does one correctly import data into h2o client in R?

我正在尝试从客户端 运行 n R 从 RStudio 将 csv 上传到 h20 服务器。这是它的样子:

library(dplyr)
library(ggplot2)
library(h2o)

localH2O = h2o.init(ip = "127.0.0.1", port = 54323)
market_data_file = system.file("extdata", "bank_customer_data.csv", package = "h2o")

market_data  = h2o.importFile(localH2O, path = market_data_file, key = "market_data")

class(market_data)

summary(market_data)

控制台上的输出显示以下内容:

market_data_file = system.file("extdata", "bank_customer_data.csv", package = "h2o")

market_data = h2o.importFile(localH2O, path = market_data_file, key = "market_data") Error in h2o.importFile(localH2O, path = market_data_file, key = "market_data") : unused argument (key = "market_data")

class(market_data) Error: object 'market_data' not found

summary(market_data) Error in summary(market_data) : object 'market_data' not found

有什么地方做错了吗?

key 不是 h2o.importFile 中的参数,这就是您收到 unused argument 错误的原因。这是当前参数

  h2o.importFile(path, destination_frame = "", parse = TRUE, header = NA,
  sep = "", col.names = NULL, col.types = NULL, na.strings = NULL,
  decrypt_tool = NULL)

所有这些都在 docs

中进行了解释

正如其他人在评论中指出的那样,"bank_customer_data.csv" 不存在于 h2o 包中,这就是 system.file 不返回任何内容的原因。

您应该尝试使用上述过程导入您知道存在的文件,并查看是否适合您。否则,如果您想使用 R 包中的数据集,请查看 R 文档中的示例

h2o.init(ip = "localhost", port = 54321, startH2O = TRUE)
prosPath = system.file("extdata", "prostate.csv", package = "h2o")
prostate.hex = h2o.importFile(path = prosPath, destination_frame = "prostate.hex")
class(prostate.hex)
summary(prostate.hex)