如何 运行 H2O.ai 在 SQL 之上
How to run H2O.ai on top of SQL
H2O.ai 的人在几张幻灯片和文档中提到 H2O.ai 可以 运行 在 SQL 之上。如何将我的 H2O.ai 实例连接到 SQL 服务器?到目前为止我能找到的唯一建议看起来相当令人失望:https://groups.google.com/forum/#!topic/h2ostream/x8BLSGbyvhA
是否有更优雅的方式直接连接到 SQL 服务器?
H2O 没有原生 JDBC 连接器(目前)。
不过,您可以在 Spark w/ Sparkling Water 中利用 H2O 的算法 (https://github.com/h2oai/sparkling-water):使用 Spark SQL 将数据摄取到 RDD 中,将其转换为 H2OFrame(您可以转换为direction), 传给H2O的algos.
一种更直截了当的方法是将数据查询到 CSV 文件中,然后 H2O 可以读取它。如果您的数据量不是太大,这可能是合理的。
H2O.ai 的人在几张幻灯片和文档中提到 H2O.ai 可以 运行 在 SQL 之上。如何将我的 H2O.ai 实例连接到 SQL 服务器?到目前为止我能找到的唯一建议看起来相当令人失望:https://groups.google.com/forum/#!topic/h2ostream/x8BLSGbyvhA
是否有更优雅的方式直接连接到 SQL 服务器?
H2O 没有原生 JDBC 连接器(目前)。
不过,您可以在 Spark w/ Sparkling Water 中利用 H2O 的算法 (https://github.com/h2oai/sparkling-water):使用 Spark SQL 将数据摄取到 RDD 中,将其转换为 H2OFrame(您可以转换为direction), 传给H2O的algos.
一种更直截了当的方法是将数据查询到 CSV 文件中,然后 H2O 可以读取它。如果您的数据量不是太大,这可能是合理的。