h2o standalone 和 hadoop 有什么区别?

What is the difference between h2o standalone and hadoop?

查看 h2o 文档,上面写着

Inside H2O, a Distributed Key/Value store is used to access and reference data, models, objects, etc., across all nodes and machines. The algorithms are implemented on top of H2O’s distributed Map/Reduce framework and utilize the Java Fork/Join framework for multi-threading. The data is read in parallel and is distributed across the cluster...

查看 h2o downloads page,我看到 h2o 有独立版本。想知道这些版本之间有什么区别?例如。我假设 h2o 算法旨在使用 MapReduce 算法,那么当使用独立模式时,即使单个主机具有与分配为 YARN 应用程序相同的内存,H2OFrame objs 上的 ML 训练是否会更慢?

主要区别在于作业的启动方式以及它们是否可以方便地访问 HDFS。

如果给定相同数量的节点并且每个节点 memory/cpu,则模型训练行为没有差异。