计算机视觉 - 两帧,重叠边界框

Computer vision - two frames, overlapping bounding boxes

情况:

房间里的某个 x, y 位置有一张床。在床上,床中央有一个苹果。

现在我的代码应该给出一个输出,即床中央有一个苹果,或者类似于床左上角的苹果。

有人可以帮助我知道如何使用 YOLO/OpenCV/Tensorflow/Torch 等解决这个问题吗?

我替Yolo答题。您要查找的是嵌套检测还是重叠检测?可以使用 Yolo 来完成。 1 重要的事情,当您注释数据集时,您还必须包括嵌套示例。如果您只在数据集中将床和苹果标记为单独的对象,Yolo 将不会检测到嵌套对象。您还必须包括床顶有苹果的图像,并为每个对象绘制 2 个边界框。参见:https://github.com/AlexeyAB/darknet/issues/2519

pkhigh 在 github 上的示例学分:https://github.com/AlexeyAB/darknet/issues/2965