PDF OCR Google 云视觉保持间距
PDF OCR Google cloud vision keep spacing
我不知道是否可行,但我收到的是 PDF 格式的表格。我需要从 PDF 中获取与文件中完全相同的位置的文本,并将其放入我可以解析的文本文档中,如:
第 4 行起始字符 50 结束字符 60
这会给我那个位置的任何文本。
这可能吗?
目前无法执行此操作。我发现 Feature Request 对 Cloud Vision API 进行了制作以获取 PDF 文件并将其导出为可搜索的 PDF,这可能会解决此问题。我建议您订阅功能请求(点击标题旁边的星号),这样可以获得更多的知名度。
在此期间,您可以查看 documentation on PDFs recognition 进行尝试,看看是否可以获得所需的行为。
如果您使用的表单具有确定的格式,您可以通过 API 的 TextAnnotation 响应来解决问题。响应会为您提供文本,以及有关文本的其他见解,例如页面、段落等。
我不知道是否可行,但我收到的是 PDF 格式的表格。我需要从 PDF 中获取与文件中完全相同的位置的文本,并将其放入我可以解析的文本文档中,如:
第 4 行起始字符 50 结束字符 60
这会给我那个位置的任何文本。
这可能吗?
目前无法执行此操作。我发现 Feature Request 对 Cloud Vision API 进行了制作以获取 PDF 文件并将其导出为可搜索的 PDF,这可能会解决此问题。我建议您订阅功能请求(点击标题旁边的星号),这样可以获得更多的知名度。
在此期间,您可以查看 documentation on PDFs recognition 进行尝试,看看是否可以获得所需的行为。
如果您使用的表单具有确定的格式,您可以通过 API 的 TextAnnotation 响应来解决问题。响应会为您提供文本,以及有关文本的其他见解,例如页面、段落等。