识别图像中的复杂对象

Recognising complex objects in an image

image-processing
neural-network
conv-neural-network

具体情况我再说一下：

我截取了 DotA 游戏的屏幕截图。我想得到的信息是什么对象，例如。英雄（还有它的名字，生命值，...），小兵（还有哪一边），塔等在图像中可见以及它们所在的位置。一个问题来自于在 DotA 2 中许多这些对象可以从多个角度查看的事实，所以让我们减少问题并假设每个对象只有一个方向。如何足够快地解决这个问题，使其能够以大约 30fps 的速度实时识别所有对象？欢迎任何帮助或建议。

我认为你有很好的标志：用于图像分割的 CNN。所以我的观点是，对于来自不同视角和比例的这么多不同对象（因为我猜你可以在 heroes/objects 上缩放 in/out），最简单的方法（但计算量最大） ) 是为每种类型的对象构建一个 CNN。

但是图像对更好地理解问题有很大帮助。

识别图像中的复杂对象

Recognising complex objects in an image

image-processing

neural-network

conv-neural-network