H2OFrame 列到数组:最快的方法?
H2OFrame column to array: quickest way?
假设我有一个名为 df
的 H2OFrame。从所述帧中获取 x
列的值作为 numpy
数组的最快方法是什么?
一个人可以做到
x_array = df['x'].as_data_frame()['x'].values
但这似乎不必要地冗长。特别是通过 pandas DataFrame
和 as_data_frame
似乎是多余的。我希望有更优雅的东西,例如df['x'].to_array()
。但是我找不到。
这是另一种方式。但是,我不确定它是否更快。我使用 h2o.as_list() 函数将列转换为列表,然后使用 np.array() 函数将列表转换为数组。
import h2o
import numpy as np
h2o.init()
# Using sample dataset from H2O
train = h2o.import_file("https://s3.amazonaws.com/erin-data/higgs/higgs_train_10k.csv")
## Creating np array from h2o frame column
np.array(h2o.as_list(train['x1']))
假设我有一个名为 df
的 H2OFrame。从所述帧中获取 x
列的值作为 numpy
数组的最快方法是什么?
一个人可以做到
x_array = df['x'].as_data_frame()['x'].values
但这似乎不必要地冗长。特别是通过 pandas DataFrame
和 as_data_frame
似乎是多余的。我希望有更优雅的东西,例如df['x'].to_array()
。但是我找不到。
这是另一种方式。但是,我不确定它是否更快。我使用 h2o.as_list() 函数将列转换为列表,然后使用 np.array() 函数将列表转换为数组。
import h2o
import numpy as np
h2o.init()
# Using sample dataset from H2O
train = h2o.import_file("https://s3.amazonaws.com/erin-data/higgs/higgs_train_10k.csv")
## Creating np array from h2o frame column
np.array(h2o.as_list(train['x1']))