计算机视觉 2.0 PDF 到文本不起作用
Computer Vision 2.0 PDF to text not working
我正在尝试使用 Computer Vision 2.0 解析 PDF 文件中的文本。我正在关注 example 并将 MediaTypeHeaderValue 更改为“application/pdf”。我收到不支持内容类型的错误。我将其更改为“multipart/form-data”并在处理过程中出错。如何使用 Computer-Vision 处理 PDF 文件?
查看用于从 PDF 中提取数据的表单识别器服务。
https://azure.microsoft.com/en-us/services/cognitive-services/form-recognizer/
凯文,
您正在使用不支持 PDF 输入的旧版“OCR”API。请使用新的 OCR 技术作为 "Read" API - see overview 处理 PDF 文档。 3.0 版自 5 月起正式发布。读取支持大图像和 multi-page 以及长达 2000 页的混合语言文档。
请参阅 Read REST API QuickStart in C#.
请注意,如果您不仅要提取文本,还想提取表格、check-boxes 和表单中的键值对等布局见解,使用 pre-built 模型并构建自定义模型来处理您的文档。现已正式发布。
我正在尝试使用 Computer Vision 2.0 解析 PDF 文件中的文本。我正在关注 example 并将 MediaTypeHeaderValue 更改为“application/pdf”。我收到不支持内容类型的错误。我将其更改为“multipart/form-data”并在处理过程中出错。如何使用 Computer-Vision 处理 PDF 文件?
查看用于从 PDF 中提取数据的表单识别器服务。 https://azure.microsoft.com/en-us/services/cognitive-services/form-recognizer/
凯文, 您正在使用不支持 PDF 输入的旧版“OCR”API。请使用新的 OCR 技术作为 "Read" API - see overview 处理 PDF 文档。 3.0 版自 5 月起正式发布。读取支持大图像和 multi-page 以及长达 2000 页的混合语言文档。 请参阅 Read REST API QuickStart in C#.
请注意,如果您不仅要提取文本,还想提取表格、check-boxes 和表单中的键值对等布局见解,使用 pre-built 模型并构建自定义模型来处理您的文档。现已正式发布。