示例标签工具 OCR 文本检测问题

Sample Labeling Tool OCR Text Detection Problems

我对 Azure 表单识别器的手写文本 OCR 有疑问。

当 运行 在 Azure 的样本标签工具中进行标签之前对手写 PDF 文件进行 OCR 时,OCR 通常会错误地检测到文本。对于其他形式分析和提取技术,通常会提供一个选项来输入本应检测到的文本,以便从根本上“纠正”OCR。为了在示例标签工具(Docker 图像)中训练 Azure 表单识别器,我没有找到覆盖 OCR 文本并输入正确文本的方法。

有什么方法可以让我自己输入 OCR 无法检测或检测不正确的文本吗?

例如,下图是 Azure 示例标签工具中的 OCR 提取的内容: OCR detection sample image.

有没有办法更正此结果并告诉表单识别器文本应为:“Bridget Sims, MD”?

目前无法立即纠正 OCR 结果并提高其准确性。典型的场景是从一小组训练文件训练一个表单识别器模型,并用它来处理更多的文档。在训练过程中,少量的 OCR 错误对模型质量来说并不重要,您可以忽略它们。产品组正在研发新版OCR,手写识别准确度更高

谢谢 -鑫 [Microsoft Azure 表单识别器团队]