示例标签工具 OCR 文本检测问题

Sample Labeling Tool OCR Text Detection Problems

我对 Azure 表单识别器的手写文本 OCR 有疑问。

当运行在 Azure 的样本标签工具中进行标签之前对手写 PDF 文件进行 OCR 时，OCR 通常会错误地检测到文本。对于其他形式分析和提取技术，通常会提供一个选项来输入本应检测到的文本，以便从根本上“纠正”OCR。为了在示例标签工具（Docker 图像）中训练 Azure 表单识别器，我没有找到覆盖 OCR 文本并输入正确文本的方法。

有什么方法可以让我自己输入 OCR 无法检测或检测不正确的文本吗？

例如，下图是 Azure 示例标签工具中的 OCR 提取的内容： OCR detection sample image.

有没有办法更正此结果并告诉表单识别器文本应为：“Bridget Sims, MD”？

目前无法立即纠正 OCR 结果并提高其准确性。典型的场景是从一小组训练文件训练一个表单识别器模型，并用它来处理更多的文档。在训练过程中，少量的 OCR 错误对模型质量来说并不重要，您可以忽略它们。产品组正在研发新版OCR，手写识别准确度更高

谢谢 -鑫 [Microsoft Azure 表单识别器团队]

示例标签工具 OCR 文本检测问题

Sample Labeling Tool OCR Text Detection Problems

ocr

microsoft-cognitive

form-recognizer