通过 AWS Rekognition 进行的文本识别无法检测到大部分文本

Text Recognition through AWS Rekognition Fails to Detect Majority of Text

我正在使用 AWS Rekognition 从转换为 jpeg 的 pdf 中检测文本。 我使用的图像包含大小约为 10-12 或常规字母页面的文本。但是,字体在整个图像中发生了多次变化。

我的检测不足和置信度低是因为文档中的文本经常更改吗?小字体?

基本上我想知道我需要什么样的 image/text 才能从检测文本算法中获得最佳结果?

检测文本API 一张图片中最多可以检测 50 个词

要被检测到,文本必须在 +/- 30 度 方向内 横轴.

而您正试图提取一个充满文本的页面,这就是问题所在:)

A​​WS 现在提供 AWS Textract 服务,专门用于图像和文档的 OCR 目的。