Firebase Vision Labeler 返回不一致的结果

Firebase Vision Labeler returning inconsistent results

我在我的一个 android 应用程序中使用 Firebase Vision Image。每当 android 模拟器拍照时,Firebase Vision Image Labeler return 都会为来自相机捕获的位图提供标签列表。

我的问题是标签几乎不准确。例如,如果我拍一张脸,它会 return 一个 80% 的置信度标签,上面写着 "dog"。然而,当我拍一张脸并将其插入 Google 的 Cloud Vision(Firebase 建立在其上)Demo labeler website 时,它 return 的响应要准确得多.

为什么 Firebase Vision responses/labels 与 Google Cloud Vision responses/labels 如此不同?

顺便说一句,我正在拍摄的照片在我的笔记本电脑上。

Firebase ML Kit 的设备上标签检测运行分辨率低于 Cloud Vision API 的 ML 模型。因此,它可以检测到更少的标签,并且可能检测到它们的准确度较低。

来自 choosing between on-device and Cloud APIs 上的文档:

Label coverage

On device: 400+ labels that cover the most commonly-found concepts in photos. See below.

Cloud: 10,000+ labels in many categories. See below.

如果您希望模型检测到的内容具有最高的准确性,您应该使用 Cloud Vision。但这确实意味着用户必须拥有有效的互联网连接,并且您将使用付费的 Cloud Vision API 而不是免费的设备模型。