识别图像中的复杂对象
Recognising complex objects in an image
具体情况我再说一下:
我截取了 DotA 游戏的屏幕截图。我想得到的信息是什么对象,例如。英雄(还有它的名字,生命值,...),小兵(还有哪一边),塔等在图像中可见以及它们所在的位置。一个问题来自于在 DotA 2 中许多这些对象可以从多个角度查看的事实,所以让我们减少问题并假设每个对象只有一个方向。如何足够快地解决这个问题,使其能够以大约 30fps 的速度实时识别所有对象?欢迎任何帮助或建议。
我认为你有很好的标志:用于图像分割的 CNN。所以我的观点是,对于来自不同视角和比例的这么多不同对象(因为我猜你可以在 heroes/objects 上缩放 in/out),最简单的方法(但计算量最大) ) 是为每种类型的对象构建一个 CNN。
但是图像对更好地理解问题有很大帮助。
具体情况我再说一下:
我截取了 DotA 游戏的屏幕截图。我想得到的信息是什么对象,例如。英雄(还有它的名字,生命值,...),小兵(还有哪一边),塔等在图像中可见以及它们所在的位置。一个问题来自于在 DotA 2 中许多这些对象可以从多个角度查看的事实,所以让我们减少问题并假设每个对象只有一个方向。如何足够快地解决这个问题,使其能够以大约 30fps 的速度实时识别所有对象?欢迎任何帮助或建议。
我认为你有很好的标志:用于图像分割的 CNN。所以我的观点是,对于来自不同视角和比例的这么多不同对象(因为我猜你可以在 heroes/objects 上缩放 in/out),最简单的方法(但计算量最大) ) 是为每种类型的对象构建一个 CNN。
但是图像对更好地理解问题有很大帮助。