Concept of mini batch in deep generative model using pyro

我是概率编程和 ML 的新手。我正在关注 pyro 网站上给出的关于深度马尔可夫模型的代码。该代码的 github 页面的 link 是:


我理解大部分代码。我不明白的部分是他们从第 175 行开始使用的小批量想法。

mini_batch is a three dimensional tensor, with the first dimension being the batch dimension, the second dimension being the temporal dimension, and the final dimension being the features (88-dimensional in our case)'

因为我想在我的数据集上使用这段代码,这是一个顺序数据。我对我的数据进行了一次热编码,使其维度为 (10000,500,20),其中 10000 是 examples/Sequences 的数量,500 是每个的长度这些序列和 20 是特征的数量。

Question 1: Could someone explain what are they doing there when they are using mini-batch?

为了优化大多数深度学习模型,我们使用了小批量梯度下降。这里,Amini_batch指的是少量的例子。比方说,我们有 10,000 个训练示例,我们想要创建 50 个示例的小批量。因此,总共将有 200 个小批量,我们将在整个数据集的一次迭代中执行 200 次参数更新。

Question 2: What does the temporal dimension mean here?

在你的数据中:(10000, 500, 20),第二个维度是指时间维度。您可以认为您有 500 个时间步长的示例 (t1, t2, ..., t500).

Question 3: How can I use my one-hot encoded data as mini-batch here?

在您的方案中,您可以将数据 (10000, 500, 20) 分成 200 个大小为 (50, 500, 20) 的小批,其中 50 是小批中 examples/Sequences 的数量,500 是每个序列的长度,20 是特征的数量。
