从机器学习算法的角度看 h2o.ai 和 SparkMLlib 的区别
Difference between h2o.ai and SparkMLlib from Machine Learning algorithm point of view
目前,我正在使用 h2o.ai
和 SparkMLlib
对机器学习库进行调查。我发现 h2o.ai
库支持的 ML 算法数量比 SparkMLlib
多,而且将 Spark 数据帧划分到训练和测试集似乎很困难(需要转换 spark 数据帧到 R/h2o 数据帧,这也是 time/resource 消耗)。
使用 h2o.ai
库而不是 SparkMLib
或者反之亦然 advantages/disadvantages 还有哪些? 我正在关注 h2o.ai
和 SparkMLlib
到基于 R 的实现 (SparkR)。所以 h2o (as.h2o)
和 SparkMLlib (as.DataFrame)
的数据帧是不同的。
目前,我正在使用 h2o.ai
和 SparkMLlib
对机器学习库进行调查。我发现 h2o.ai
库支持的 ML 算法数量比 SparkMLlib
多,而且将 Spark 数据帧划分到训练和测试集似乎很困难(需要转换 spark 数据帧到 R/h2o 数据帧,这也是 time/resource 消耗)。
使用 h2o.ai
库而不是 SparkMLib
或者反之亦然 advantages/disadvantages 还有哪些? 我正在关注 h2o.ai
和 SparkMLlib
到基于 R 的实现 (SparkR)。所以 h2o (as.h2o)
和 SparkMLlib (as.DataFrame)
的数据帧是不同的。