如何让 Watson Visual Recognition 识别每个对象?

How to make Watson Visual Recognition identify each object?

当我提交一张将几种蔬菜组合在一起的图片时,它没有 return 每种蔬菜的名称。但是,如果我将蔬菜分成不同的图片以供识别,则效果很好。

我怎样才能return加上每种蔬菜的名字?或者我需要使用自定义分类器吗?但是沃森已经知道这些蔬菜了。

Watson 视觉识别无法告诉系统要查找的对象数量。您可以做的最接近的事情是将图像分割成多个部分并提交每个部分。

解决此问题的有效方法是使用滑动 windows 从包含多个实体的图像中创建较小的子图像。

可以在 here GitHub 上找到一个很好的例子。

这是一个展示滑动 window 方法的视频 https://youtu.be/wEs1imQmk-Y