通过 AWS Rekognition 进行的文本识别无法检测到大部分文本
Text Recognition through AWS Rekognition Fails to Detect Majority of Text
我正在使用 AWS Rekognition 从转换为 jpeg 的 pdf 中检测文本。
我使用的图像包含大小约为 10-12 或常规字母页面的文本。但是,字体在整个图像中发生了多次变化。
我的检测不足和置信度低是因为文档中的文本经常更改吗?小字体?
基本上我想知道我需要什么样的 image/text 才能从检测文本算法中获得最佳结果?
检测文本API
一张图片中最多可以检测 50 个词
要被检测到,文本必须在 +/- 30 度 方向内
横轴.
而您正试图提取一个充满文本的页面,这就是问题所在:)
AWS 现在提供 AWS Textract 服务,专门用于图像和文档的 OCR 目的。
我正在使用 AWS Rekognition 从转换为 jpeg 的 pdf 中检测文本。 我使用的图像包含大小约为 10-12 或常规字母页面的文本。但是,字体在整个图像中发生了多次变化。
我的检测不足和置信度低是因为文档中的文本经常更改吗?小字体?
基本上我想知道我需要什么样的 image/text 才能从检测文本算法中获得最佳结果?
检测文本API 一张图片中最多可以检测 50 个词
要被检测到,文本必须在 +/- 30 度 方向内 横轴.
而您正试图提取一个充满文本的页面,这就是问题所在:)
AWS 现在提供 AWS Textract 服务,专门用于图像和文档的 OCR 目的。