使用 GPU 在 H2O Deep Water 上进行 Word2Vec 词嵌入
Word2Vec word embeddings on H2O Deep Water with GPU
我们按照文本分类过程迭代了以下项目:
- 使用文本文档创建 Word2Vec 词嵌入模型。
- 执行网格搜索和树深度参数。
- Select 表现最好的最终 GBM 模型。
当我们遍历列表时 CPU 内核以 %100 负载工作。是否有任何程序或解决方案使用 H2O 深水 GPU 功能迭代上述过程?
不,不,也许。
也许你可以从 GBM 切换到 xgboost,它确实有一个 GPU 选项(我相信只支持单节点,目前只在 Linux 中)。 xgboost 在小数据集上显然稍微快一些,h2o.gbm 在大数据集上稍微快一些。如果你有免费的 GPU,并且使用的是最新版本的 H2O,应该很容易将 h2o.gbm
与 h2o.xgboost
交换(H2OXGBoostEstimator
如果使用 Python API) 自己看看。
我很想知道相关的时间安排!
(顺便说一句,第二个 "no" 是专门用于 GPU 的网格;但是所有的努力都在模型中,而不是网格本身,所以第二个 "no" 也可以"N/A")
我们按照文本分类过程迭代了以下项目:
- 使用文本文档创建 Word2Vec 词嵌入模型。
- 执行网格搜索和树深度参数。
- Select 表现最好的最终 GBM 模型。
当我们遍历列表时 CPU 内核以 %100 负载工作。是否有任何程序或解决方案使用 H2O 深水 GPU 功能迭代上述过程?
不,不,也许。
也许你可以从 GBM 切换到 xgboost,它确实有一个 GPU 选项(我相信只支持单节点,目前只在 Linux 中)。 xgboost 在小数据集上显然稍微快一些,h2o.gbm 在大数据集上稍微快一些。如果你有免费的 GPU,并且使用的是最新版本的 H2O,应该很容易将 h2o.gbm
与 h2o.xgboost
交换(H2OXGBoostEstimator
如果使用 Python API) 自己看看。
我很想知道相关的时间安排!
(顺便说一句,第二个 "no" 是专门用于 GPU 的网格;但是所有的努力都在模型中,而不是网格本身,所以第二个 "no" 也可以"N/A")