如何使用 Firebase / ML Kit 识别和计数对象

How to recognize and count objects with Firebase / ML Kit

我想识别和计算图片中的物体,例如计算邻里图片中的房屋数量。使用 ML Kit 执行此操作的最佳方法是什么?

我需要使用 Object Detection API 吗?或者是否可以使用直接的图像标签器获得多个“房屋”标签?

ML Kit Object Detection API(请注意,它现在作为独立 SDK 提供)可以对图像/视频流中的对象进行计数,但仅限于 5 个最大的对象。此外,您应该评估对象检测是否适用于您的用例。它是一个非常通用的定位器,适用于大多数对象,但是当对象靠得很近/重叠时,它可能无法区分它们。

如果您需要检测 5 个以上的对象,如果通用模型不适合您的用例,我建议直接使用 TensorFlow Lite with some of the pre-trained models available on TF Hub or train one yourself using AutoML Vision Edge 查看。

首先,图像标签分配描述图像场景的标签。但是,它不计算对象的数量,您通常会得到一个标签“house”。