如何使用视觉识别获取自定义对象在图像上的位置 api

Question

我知道有很多视觉识别 API 可以提供图像内容识别，例如 Clarifai、Watson、Google Cloud Vision、Microsoft Cognitive Services。这些服务的响应很简单json，包含不同的标签，例如

{ 
   man: 0.9969295263290405,
   portrait: 0.9949591159820557,
   face: 0.9261120557785034
}

问题是我不仅需要知道图像上的内容，还需要知道该对象的位置。其中一些 API 具有此类功能，但仅用于面部检测。

所以有人知道是否有这样的 API 或者我需要在 OpenCV 上为每个对象训练自己的 haar 级联。

非常感谢分享一些信息。

Answer 1

你可以看看 Wolfram Cloud/Mathematica。

它能够检测图片中的对象位置。

一些例子。

How to get a position of custom object on image using vision recognition api