python, h2o.import_file() return 空行

python, h2o.import_file() return empty line

我在 h2o 中读取文件时遇到一些问题。

import h2o
from h2o.estimators.deeplearning import H2ODeepLearningEstimator
h2o.init()
train = h2o.import_file("("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv"")
splits = train.split_frame(ratios=[0.75], seed=1234)
dl = H2ODeepLearningEstimator(distribution="quantile",quantile_alpha=0.8)
dl.train(x=range(0,2), y="petal_len", training_frame=splits[0])
print(dl.predict(splits[1]))

UPDATE_1,第四行是这样的形式(不好意思,我从IDE抄错了):

train = h2o.import_file("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv")

我收到 H2OTypeError:参数 x 应该是 None |整数 |字符串 |列表(字符串|整数)| set(integer | string),得到范围 range(0, 2)。

这是因为 "train" 是空的。

In [23]: train

Out[23]: 

我认为读取、链接和手动下载文件时出现问题。

train = h2o.import_file("iris_wheader.csv")

但我得到了相同的结果。

In [26]: train

Out[26]: 

我连接了 pandas 并在 pandas 中打开了这个 .csv。它打开了,我得到了一个 pandas-dataframe,我使用了

 train = h2o.H2OFrame(train) 

得到一列空车。

In [29]: train

Out[29]:

如何解决这个问题?

UPDATE_2 当我访问 127.0.0.1:54321/flow/index.html 时,它显示数据帧已加载到集群中。但是在 Python 中,我得到了空车。我将 Spyder IDE 与 IPython 控制台一起使用,它会以某种方式影响结果吗?

这行有问题:

train = h2o.import_file("("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv"")

你有多余的"和(,应该是:

train = h2o.import_file("https://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv")

然后你会看到 trainprint(train) 给出输出:

In [6]: train
Out[6]:   sepal_len    sepal_wid    petal_len    petal_wid  class
-----------  -----------  -----------  -----------  -----------
        5.1          3.5          1.4          0.2  Iris-setosa
        4.9          3            1.4          0.2  Iris-setosa
        4.7          3.2          1.3          0.2  Iris-setosa
        4.6          3.1          1.5          0.2  Iris-setosa
        5            3.6          1.4          0.2  Iris-setosa
        5.4          3.9          1.7          0.4  Iris-setosa
        4.6          3.4          1.4          0.3  Iris-setosa
        5            3.4          1.5          0.2  Iris-setosa
        4.4          2.9          1.4          0.2  Iris-setosa
        4.9          3.1          1.5          0.1  Iris-setosa

[150 rows x 5 columns]


In [7]: train.nrow
Out[7]: 150

In [8]: print(train)
  sepal_len    sepal_wid    petal_len    petal_wid  class
-----------  -----------  -----------  -----------  -----------
        5.1          3.5          1.4          0.2  Iris-setosa
        4.9          3            1.4          0.2  Iris-setosa
        4.7          3.2          1.3          0.2  Iris-setosa
        4.6          3.1          1.5          0.2  Iris-setosa
        5            3.6          1.4          0.2  Iris-setosa
        5.4          3.9          1.7          0.4  Iris-setosa
        4.6          3.4          1.4          0.3  Iris-setosa
        5            3.4          1.5          0.2  Iris-setosa
        4.4          2.9          1.4          0.2  Iris-setosa
        4.9          3.1          1.5          0.1  Iris-setosa

[150 rows x 5 columns]