Firebase Ml 套件,Google 云视觉 API 或 openCV

Firebase Ml kit, Google cloud vision API or openCV

我想构建一个 android 应用程序用于注视跟踪,我想问一下我应该使用以下哪些工具以获得更好的结果。

我不知道你是打算创建一个商业应用程序还是用于研究目的,这两种情况下要考虑的事情会有所不同。

对于对象跟踪,我可能会使用 google 的 mlkit,它有一些 ready-to-use 模型也可以离线工作,它还简化了纯 tensorflow 的所有艰苦工作(即使在iOS) 如果您想使用自定义模型。因此,您的艰苦工作将是创建一个高效的模型,而不是 运行 构建它。

Google Cloud Vision API 我还没有用过,只是GCP机器训练了一个NN,他们派上了用场。

OpenCV 是一个很好的工具,但可能难以实施和维护,您的应用程序大小也会大大增加。我在 2 年前的期末论文中使用了 HaarCascade,工作很辛苦,结果也不那么准确,今天我会检查 OpenCV 的 DNN 模块,并像 here. To summarize, I'd just recomment it if you have some specific image processing demand, but first check the Android's ColorFilter or ImageFilterView. If you choose to use OpenCV, I'd recommend you to compile it by yourself with cmake like described here 一样使用 Yolo,只使用你需要的模块使用,所以你的应用程序大小不会增加那么多。

还有一些其他的选择,比如Dlib或者PyTorch,我去年一直在用dlib的SVM和自定义模型,效果不错,但是慢到运行,大约3~4秒,与具有 tensorflow 的神经网络相比,在 50~60 毫秒内 运行s(使用量化模型甚至更快)。我没有使用 PyTorch 或其他框架的经验,无法与您分享一些东西。