CNN-LSTM 图像分类

CNN-LSTM Image Classification

是否可以将 512x512 rgb 图像重塑为 (timestep, dim)?否则,我正在尝试将此重塑层:Reshape((23, 3887)) 转换为 512 vice 299。此外,是否有任何文档解释如何确定 Keras 的 input_dim 和时间步长?

看来您的问题与我今天早些时候遇到的问题类似。看这里:Keras functional API: Combine CNN model with a RNN to to look at sequences of images

现在添加我也链接的问题的答案。设 number_of_imagesn。在您的情况下,原始数据格式为 (n, 512, 512, 3)。然后您需要做的就是决定每个序列需要多少张图像。假设您想要一个包含 5 张图像的序列,并且总共获得了 5000 张图像。然后重塑 (1000, 5, 512, 512, 3) 应该做。通过这种方式,模型可以看到 5 张图像的 1000 个序列。