是否需要模型训练?

Is Model Training Required?

AFR 新手,请原谅愚蠢的问题。我们是一家图书出版商,有时根本没有特定的格式布局,因为即使是同一主题,不同的作者也有偏好,例如食谱。但是它们都被包裹在一个页面中。

所以我的问题是是否有可用的通用布局,因此我们不需要进行培训?这样我们将利用 boundingBox 重建布局并将它们拼凑在一起。 URL 的样本会很棒。谢谢

是的,您可以使用表单识别器布局从书中提取文本和表格并分析页面。您可以使用示例工具 UX - select Layout,

进行试用

或使用 API - https://{endpoint}/formrecognizer/v2.1-preview.3/layout/analyze?readingOrder=natural

查看此处了解更多信息 - https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/concept-layout

如果页面有不同的列或不同分组中的其他文本将按阅读顺序提取文本,则使用自然阅读顺序按阅读顺序提取文本。