计算机视觉 2.0 PDF 到文本不起作用

Computer Vision 2.0 PDF to text not working

我正在尝试使用 Computer Vision 2.0 解析 PDF 文件中的文本。我正在关注 example 并将 MediaTypeHeaderValue 更改为“application/pdf”。我收到不支持内容类型的错误。我将其更改为“multipart/form-data”并在处理过程中出错。如何使用 Computer-Vision 处理 PDF 文件？

查看用于从 PDF 中提取数据的表单识别器服务。 https://azure.microsoft.com/en-us/services/cognitive-services/form-recognizer/

凯文，您正在使用不支持 PDF 输入的旧版“OCR”API。请使用新的 OCR 技术作为 "Read" API - see overview 处理 PDF 文档。 3.0 版自 5 月起正式发布。读取支持大图像和 multi-page 以及长达 2000 页的混合语言文档。请参阅 Read REST API QuickStart in C#.

请注意，如果您不仅要提取文本，还想提取表格、check-boxes 和表单中的键值对等布局见解，使用 pre-built 模型并构建自定义模型来处理您的文档。现已正式发布。

计算机视觉 2.0 PDF 到文本不起作用

Computer Vision 2.0 PDF to text not working

pdf

azure

computer-vision

azure-cognitive-services