RNN 如何从图像中提取特征

How RNN extract features from an image

嗨，我目前正在研究我的论文，即为乌尔都语构建 OCR。我有文字，写在图像上。在 CNN 中，我知道有卷积层和池化层来学习模式或（提取特征）。我读到的关于 RNN 的内容是它学习序列。我想问一下RNN如何提取特征才能知道，image中有什么？

RNN 网络使用随时间更新的隐藏层。根据减少的错误（或损失）获取样本并预测下一个样本。 LSTM 是一种可以克服遗忘长期依赖性的 RNN。这个类型，对你的论文可能有用。

RNN 在训练阶段基本上需要一些特征和标签来学习数据中的序列。如果是数值数据，则没有任何问题，我们只需将数据集划分为特征 (X) 和目标值 (Y)。但是在图像数据的情况下，我们使用CNN和RNN的组合（CNN-RNN）。这里在 RNN 层的顶部（LSTM 或 GRU）卷积层用于从图像中提取特征，然后我们将这些特征提供给 RNN 层。

RNN 如何从图像中提取特征

How RNN extract features from an image

deep-learning

conv-neural-network

rnn