RNN / LSTM 可以用于非标准文本 OCR 吗?
Can RNN / LSTM be used for non standard text OCR?
我读过 LSTM 和 RNN,甚至是 CTC。据我了解,RNN 用于计算序列中缺失的标记(例如,句子中的单词)。但是,我的问题是阅读草书书写的人名。许多名字并不流行,无法在语言模型中找到,所以如果 RNN 只是预测缺失的单词,它不会成功,因为我没有可能的人名的完整数据集,对吗?
1) 我可以使用 RNN 来识别非标准单词吗? (例如 rare/unpopular 人名)
2) 如果没有,是否还有其他替代方案。 ?或者我必须使用OCR的传统方法(尝试分割然后分类字符)?
由 CNN + RNN + CTC 构建的神经网络在 字符级 上工作。
他们学习预测字符串,不关心单词或底层语言。
你当然可以将字典 and/or 语言模型集成到 CTC 解码器中,但你不必这样做。
这样,这样的网络 可以仅通过查看字符来读取任意人名 。
有关使用此类神经网络模型进行文本识别的高级介绍,请参阅 https://towardsdatascience.com/2326a3487cd5
仅需补充说明:RNN 用于沿序列传播信息,例如找出一个模棱两可的角色可能取决于其周围环境。
我读过 LSTM 和 RNN,甚至是 CTC。据我了解,RNN 用于计算序列中缺失的标记(例如,句子中的单词)。但是,我的问题是阅读草书书写的人名。许多名字并不流行,无法在语言模型中找到,所以如果 RNN 只是预测缺失的单词,它不会成功,因为我没有可能的人名的完整数据集,对吗?
1) 我可以使用 RNN 来识别非标准单词吗? (例如 rare/unpopular 人名)
2) 如果没有,是否还有其他替代方案。 ?或者我必须使用OCR的传统方法(尝试分割然后分类字符)?
由 CNN + RNN + CTC 构建的神经网络在 字符级 上工作。 他们学习预测字符串,不关心单词或底层语言。 你当然可以将字典 and/or 语言模型集成到 CTC 解码器中,但你不必这样做。 这样,这样的网络 可以仅通过查看字符来读取任意人名 。 有关使用此类神经网络模型进行文本识别的高级介绍,请参阅 https://towardsdatascience.com/2326a3487cd5
仅需补充说明:RNN 用于沿序列传播信息,例如找出一个模棱两可的角色可能取决于其周围环境。