Sparkling Water 比 H20 机器学习库有哪些优势

Which the benefits of Sparking Water over H20 Machine learning Library

我了解到 Sparkling Water 是在 Spark 环境中执行的 H20,因此它可以使用 Spark 引擎(和所有 Spark 分布式结构)来分布式计算,但就性能而言,这是因为 H2O 的好处已经是用于机器学习的分布式且可扩展的库?

而且,单机版的 H2O 真的能够管理计算机集群上的分布式处理吗?

与普通 H2O 相比,使用 Sparkling Water 的主要好处是它非常适合现有的 Spark 管道。如果您还没有使用 Spark,那么最好只使用常规的 H2O 库。 H2O 已经分布式,因此将 Spark 添加到等式中不会在分布式计算方面提供任何附加值。

H2O 有很多与 Spark 相同的组件,例如分布式数据帧和共享内存计算。所以是的,H2O 能够在多核或多节点计算机集群上管理分布式处理。这正是它的设计目的。