天蓝色 |表单识别器预选文件?

Azure | Form Recognizer pre selection of documents?

表单识别器是否能够 pre-select/pre-diffrentiate 文档在被表单识别器识别工具处理之前进行处理?

例如它将能够区分票据或票据,并且只会使用票据识别工具。

不,这不是表单识别器的功能。

例如,您可以使用自定义视觉实现自己的分类器(用于图像文档)

Azure 表单识别器是一种认知服务,它使用机器学习技术从表单文档(无论是 PNG、JPEG、TIFF 还是 PDF)中识别和提取文本、key/value 对和 table 数据.

使用表单识别器,您无法找到文档的类型或区分文档。在提取数据之前,您需要训练任何类型的表格。

出于隔离的目的,你不得不使用一些其他的service/tool。例如,Azure Computer Vision 服务可用于查找图像类型。

正如其他答案所建议的那样,您可以实现自己的分类器。您可以调用该模型,并检查 return 值的置信度分数,如果它太低,那么它不是您要处理的文档。

如果你想构建 2 个模型,一个用于帐单,一个用于笔记,每个模型提取不同的集合 key/values,那么 Form Recognize 团队正在开发一项功能以找到最适合你的表格, 敬请期待。

谢谢

-xin(来自 MSFT Form Recognize Team)