有人可以解释使用 RNN 的回归模型的批量大小和时间步长吗?

Can someone explain batch-size and timestep for a regression model using RNN?

我正在研究一个每小时有 50 个数据点的回归模型。我很难决定批量大小和时间步长之间的区别。据我了解,批量大小用于决定在进行预测之前我们要考虑多少个数据点。值越大,模型收敛所需的时间越长。如果是这样的话,我很清楚批量大小的定义。所以如果我的模型不需要很长时间,我可以只使用最大值吗?这个最大值会是测试数据大小吗?

那么时间步长呢?对于您每分钟测量一次温度直到 30 小时的模型,时间步长是多少? 如果知道使用 RNN 进行回归的人可以回答我的疑问,我将不胜感激。

给定:

import numpy as np

x = np.array([[[1], [0], [1]]])

print(x.shape)

输出:

(1, 3, 1)

这是 m 个样本 s 个时间步,每个时间步 e 个测量值。

(m, s, e)

无论如何,数据点的数量就是数组的大小,所以:

m * s * e

每个样本的数据点数:

s * e

如果您每秒测量一个样品的温度一小时。

(1, 3600, 1)

如果你测量温度和湿度。

(1, 3600, 2)

假设您同时对 2 个样本(在位置 A 和 B)执行此操作。

(2, 3600, 2)

批量大小根本不相关。

对于每个纪元,它仅表示您希望一次 运行 多少个样本。例如,对于批量大小为 50 的 100 个样本,每个时期有两次权重更新。