h2o 的时间差异（强化学习）

Temporal Difference (Reinforcement Learning) by h2o

我想知道h2o是否能够实现Temporal Difference（强化学习）？

我知道 TensorFlow 有这个能力。

可以找到 H2O 的可用算法列表 here. The short answer to your question is no. Details on the Deep Learning algorithm that is available here，为了您的方便，我会重新发布：

H2O-3 的深度学习算法基于多层前馈人工神经网络，该网络使用反向传播通过随机梯度下降进行训练。该网络可以包含大量隐藏层，这些隐藏层由具有 tanh、整流器和 maxout 激活函数的神经元组成。自适应学习率、速率退火、动量训练、dropout、L1 或 L2 正则化、检查点和网格搜索等高级功能可实现高预测准确性。每个计算节点使用多线程（异步）在其本地数据上训练全局模型参数的副本，并通过网络中的模型平均定期为全局模型做出贡献。

前馈人工神经网络 (ANN) 模型，也称为深度神经网络 (DNN) 或多层感知器 (MLP)，是最常见的深度神经网络类型，也是唯一受原生支持的类型在 H2O-3 中。几种其他类型的 DNN 也很流行，例如卷积神经网络 (CNN) 和递归神经网络 (RNN)。 MLP 在交易（表格）数据上运行良好；然而，如果你有图像数据，那么 CNN 是一个不错的选择。如果您有顺序数据（例如文本、音频、时间序列），那么 RNN 是一个不错的选择。