OCR 使用 google-cloud-vision - 结果不包含波兰语、德语等的 uni 字符

OCR using google-cloud-vision - Result does not contain uni characters for Polish, German, etc

我正在尝试使用 Google Vision API 中的 OCR 功能,但无法收到预期的结果。我希望在结果中看到德语的 ü 和波兰语的 ć、ń、ó、ś、ź、ł、ę、ą。有什么办法可以做到吗?

获取的文本不包含多种语言的 uni 字符:波兰语、德语。但是支持的语言和语言列表中的这种语言被正确检测到。

我在此处使用拖放选项 https://cloud.google.com/vision/ 和 CloudVision Android 示例。谢谢你的任何建议。

我解决了这个问题。 要在结果中添加 UNI 字符,您需要设置 LanguageHints.

对于 Java 它将是:

ImageContext imageContext = new ImageContext();
List<String> languages = new ArrayList<>();
languages.add("pl");
imageContext.setLanguageHints(languages);
annotateImageRequest.setImageContext(imageContext);

现在我在结果中有波兰语的 ć、ń、ó、ś、ź、ł、ę、ą。