视觉语言检测

Vision language detection

我正在使用 Apple 提供的 Vision 将一些图像转换为文本。 它运行良好,但我目前遇到的问题是汉字。

我目前正在这样做:

let request = VNRecognizeTextRequest(completionHandler: recognizeTextHandler)
request.recognitionLevel = .accurate
request.recognitionLanguages = try! VNRecognizeTextRequest.supportedRecognitionLanguages(for: .accurate,
revision: request.revision)

看起来它支持一堆拉丁语言和中文。

Vision 似乎能够自动检测德语等语言,但我必须在 recognitionLanguages 属性 的前面指定中文才能使用中文.

有什么方法可以自动检测图片的语言吗?

I have to specify Chinese at the front of the recognitionLanguages property for it to work with Chinese

这就是它的设计方式。 .accurate 使用基于 ML 的识别器,因为中文真的很复杂,所以它 必须 排在第一位。在 8:02 上查看 WWDC21 的 Extract document data using Vision

这也意味着没有办法自动检测图像的语言。