使用 GPU 在 H2O Deep Water 上进行 Word2Vec 词嵌入

Word2Vec word embeddings on H2O Deep Water with GPU

我们按照文本分类过程迭代了以下项目:

  1. 使用文本文档创建 Word2Vec 词嵌入模型。
  2. 执行网格搜索和树深度参数。
  3. Select 表现最好的最终 GBM 模型。

当我们遍历列表时 CPU 内核以 %100 负载工作。是否有任何程序或解决方案使用 H2O 深水 GPU 功能迭代上述过程?

不,不,也许。

也许你可以从 GBM 切换到 xgboost,它确实有一个 GPU 选项(我相信只支持单节点,目前只在 Linux 中)。 xgboost 在小数据集上显然稍微快一些,h2o.gbm 在大数据集上稍微快一些。如果你有免费的 GPU,并且使用的是最新版本的 H2O,应该很容易将 h2o.gbmh2o.xgboost 交换(H2OXGBoostEstimator 如果使用 Python API) 自己看看。

我很想知道相关的时间安排!

(顺便说一句,第二个 "no" 是专门用于 GPU 的网格;但是所有的努力都在模型中,而不是网格本身,所以第二个 "no" 也可以"N/A")