RNN 如何从图像中提取特征

How RNN extract features from an image

嗨,我目前正在研究我的论文,即为乌尔都语构建 OCR。我有文字,写在图像上。在 CNN 中,我知道有卷积层和池化层来学习模式或(提取特征)。我读到的关于 RNN 的内容是它学习序列。我想问一下RNN如何提取特征才能知道,image中有什么?

RNN 网络使用随时间更新的隐藏层。根据减少的错误(或损失)获取样本并预测下一个样本。 LSTM 是一种可以克服遗忘长期依赖性的 RNN。这个类型,对你的论文可能有用。

RNN 在训练阶段基本上需要一些特征和标签来学习数据中的序列。如果是数值数据,则没有任何问题,我们只需将数据集划分为特征 (X) 和目标值 (Y)。但是在图像数据的情况下,我们使用CNN和RNN的组合(CNN-RNN)。这里在 RNN 层的顶部(LSTM 或 GRU)卷积层用于从图像中提取特征,然后我们将这些特征提供给 RNN 层。