Sparkling water: Can't make use of the support of spark ml pipelines

根据 Sparkling water 家伙的 this 博客,您现在可以使用 Spark ML 管道组件在最新版本中构建 DL 模型。我尝试在 build.sbt

"org.apache.spark" % "spark-mllib_2.10" % "2.0.0" % "provided",
"ai.h2o" % "sparkling-water-core_2.10" % "1.6.5" % "provided"

但运气不好,尝试导入 org.apache.spark.ml.h2o.H2OPipeline 不起作用。 spark.ml 中的 h2o 包似乎不存在于火花罐中。尽管它似乎适用于上述 link 以及 here。我真的很想重用我的 spark-mllib 特征转换器来使用 h2o 创建 DL 模型,如博客中所示。



1) 请不要将 spark 2 与 sw 1.6.5 一起使用 - 它不会工作。我们为 scala 2.11 发布了 sw2.0 https://mvnrepository.com/artifact/ai.h2o/sparkling-water-core_2.11

2) 您只是在构建中添加了 SW 核心,您正在寻找的 类 在 sparkling-water-ml https://mvnrepository.com/artifact/ai.h2o/sparkling-water-ml_2.11

我使用了以下版本的 运行 H2O 示例和 Maven pom.xml,它正在工作

  • Spark - 1.6
  • 苏打水 - 1.6.8
  • ai h2o -

这里是maven pom.xml(请参考GIT repo - https://github.com/seerampavan/H2oTesting/blob/master/pom.xml


    <!-- Force import of Spark's servlet API for unit tests -->

                <!-- make sure wrong scala version is not pulled in -->
                <!-- make sure wrong scala version is not pulled in -->










