Google 的愿景更新 API 的回应

Updates in Google's vision API's response

过去几个月我一直在使用 Google 的视觉 API 进行文本检测。 API return 是特定 image/document 中出现的 "map" 个单词。 "map" (JSON) 中的每个元素都将包含一个单词的文本及其在文档中的坐标

早期映射用于根据空格特殊字符将文本分解为单词...现在似乎文本被分解为基于单词的 空间。

例如,带有文本 "Foo.Bar Hello World" 的文档将有 4 个元素,即 4 个单词,因为 "word" 也意味着在特殊字符上打破文本...但现在 "Foo.Bar Hello World" 结果只有3个字。

我的问题是 有没有办法选择我们可以使用哪个版本的API? 要么 有没有一种方法可以跟踪 TEXT_DETECTION 模型中 API/the 变化的 return 结构的变化?

我查看的内容:

  1. https://cloud.google.com/vision/docs/release-notes -> 这包含 API 作为一个整体的版本,而不是 OCR 的模型 运行 或模型结果的 "post-processing" 的变化。
  2. cloud-vision-discuss google 类似问题的群组。

我们完全遇到了同样的问题。看看Google的回答难以置信:

我们刚刚收到 Vision API 工程团队的更新,他们最近刚刚在上周发布了一个新的 OCR 模型,他们告诉我们很快就会发布发行说明。

工程团队还通知我们,他们已经意识到这个问题,他们正在进一步调查。

因此,我已要求他们向我们提供有关 OCR 模型质量回归的最新信息。我们还询问了他们使用以前模型版本的可能性。

没有预计 Vision API 团队何时会回复我们他们的回复,但请期待我们最迟在本周末或他们更新后立即通知您我们。

现在(5 月 18 日)Google 更新了有关 15 日所做更改的发行说明。

https://cloud.google.com/vision/docs/release-notes?hl=en

简而言之:"wrong punctuation" 的问题将持续存在,并将成为正式生产版本。 6月30日起,别无选择!

如果您的生产应用程序具有 Google 愿景,请立即查看您的计划并做好应急准备。

enter image description here