Google Cloud Vision API 是否支持从 pdf/image 读取具有组合字段的手写或键入文本

Does Google Cloud Vision API support reading handwritten or typed text from pdf/image having comb fields

我正在尝试从具有组合字段的表单中读取手写或键入的文本,如下图所示

test image with comb fields.

我尝试使用 Cloud Vision API 阅读 PDF 和手写 OCR(DOCUMENT_TEXT_DETECTION/TEXT_DETECTION 类型),但它没有返回正确的数据。字段分隔符(|)被读取为我 所以, Google Cloud Vision API 是否支持从具有 组合字段 的 pdf/image 读取手写或键入的文本? 或者 在阅读文本之前,是否可以选择模糊或删除字母之间的竖线?

Vision API 请求中没有 option/parameter 指定组合字段。为了提高手写识别的结果,我建议对图像进行预处理以去除梳状场。由于 Vision API 不适合预处理图像,在这种情况下您将不得不自己完成,这将需要额外的编码。如果文本和组合字段的颜色是不同级别的黑色或不同颜色,您可以尝试应用一种名为 Thresholding 的方法。另一种可能的选择是拍摄具有梳状字段但没有手写文本的相同图像,并执行减法,这将导致图像只有手写文本。

有一种称为智能字符识别 (ICR) 的 OCR 变体,它与此完全兼容。这些盒子实际上更容易识别。