Google Cloud Vision API 是否支持从 pdf/image 读取具有组合字段的手写或键入文本

Does Google Cloud Vision API support reading handwritten or typed text from pdf/image having comb fields

google-cloud-vision

我正在尝试从具有组合字段的表单中读取手写或键入的文本，如下图所示

test image with comb fields.

我尝试使用 Cloud Vision API 阅读 PDF 和手写 OCR（DOCUMENT_TEXT_DETECTION/TEXT_DETECTION 类型），但它没有返回正确的数据。字段分隔符（|）被读取为我所以， Google Cloud Vision API 是否支持从具有 组合字段 的 pdf/image 读取手写或键入的文本？或者在阅读文本之前，是否可以选择模糊或删除字母之间的竖线？

Vision API 请求中没有 option/parameter 指定组合字段。为了提高手写识别的结果，我建议对图像进行预处理以去除梳状场。由于 Vision API 不适合预处理图像，在这种情况下您将不得不自己完成，这将需要额外的编码。如果文本和组合字段的颜色是不同级别的黑色或不同颜色，您可以尝试应用一种名为 Thresholding 的方法。另一种可能的选择是拍摄具有梳状字段但没有手写文本的相同图像，并执行减法，这将导致图像只有手写文本。

有一种称为智能字符识别 (ICR) 的 OCR 变体，它与此完全兼容。这些盒子实际上更容易识别。

Google Cloud Vision API 是否支持从 pdf/image 读取具有组合字段的手写或键入文本

Does Google Cloud Vision API support reading handwritten or typed text from pdf/image having comb fields

google-cloud-vision