RNN / LSTM 可以用于非标准文本 OCR 吗？

Can RNN / LSTM be used for non standard text OCR?

我读过 LSTM 和 RNN，甚至是 CTC。据我了解，RNN 用于计算序列中缺失的标记（例如，句子中的单词）。但是，我的问题是阅读草书书写的人名。许多名字并不流行，无法在语言模型中找到，所以如果 RNN 只是预测缺失的单词，它不会成功，因为我没有可能的人名的完整数据集，对吗？

1) 我可以使用 RNN 来识别非标准单词吗？（例如 rare/unpopular 人名）

2) 如果没有，是否还有其他替代方案。？或者我必须使用OCR的传统方法（尝试分割然后分类字符）？

由 CNN + RNN + CTC 构建的神经网络在 字符级 上工作。他们学习预测字符串，不关心单词或底层语言。你当然可以将字典 and/or 语言模型集成到 CTC 解码器中，但你不必这样做。这样，这样的网络 可以仅通过查看字符来读取任意人名 。有关使用此类神经网络模型进行文本识别的高级介绍，请参阅 https://towardsdatascience.com/2326a3487cd5

仅需补充说明：RNN 用于沿序列传播信息，例如找出一个模棱两可的角色可能取决于其周围环境。

RNN / LSTM 可以用于非标准文本 OCR 吗？

Can RNN / LSTM be used for non standard text OCR?

ocr

lstm

rnn

ctc