使用多个校准相机唯一识别场景中的对象

Uniquely identify objects in a scene using multiple calibrated cameras

我有一个 多个摄像机 都指向同一个场景的设置。所有相机都校准到相同的世界坐标系(即:我知道所有相机相对于世界坐标系原点的位置)。 在来自摄像机的每张图像中,我将检测场景中的对象(分割)。我的目标是计算场景中的所有对象,我不想计算一个对象两次,因为它会出现在多个图像中。这意味着如果我在图像A中检测到一个物体并且在图像B中检测到一个物体,那么我应该能够确认这是否是同一个物体。应该是可以的使用校准后的相机获得的 3D 信息来执行此操作。我在想以下几点:

解决这个问题的好方法是什么?

你是否只知道“对象”,而不知道类别或身份,除了边界框或掩码之外没有其他图像信息?那就不可能了。

考虑彻底简化,因为我现在不想画视锥体

黑盒子是实物。左轴和底轴是它们的投影。给定这些投影,深灰色框也将是框的有效假设。

你无法分辨盒子的真实位置。

如果您有东西 来消除不同对象检测的歧义,那么是的,这是可能的。

其中一个非常 fine-detail 的变体是块匹配以获得视差图(立体视觉)。这是“运动结构”的特例。

如果你的“物体”有纹理,你愿意计算点云,那你就可以。