从 2D 图像定位 3D 对象

3D object localization from 2D image

我有一张 2D 图像,其中的车辆由 2D 边界框定位。我还有 3x3 单应矩阵和相机校准的重投影误差。这些信息是否足以找到车辆的 3D 位置?

这是我在这里的第一个问题,所以如果我需要提供更多信息,请告诉我。

无法从 2D 图像获取 3D 坐标。您可以将每个像素映射到来自相机节点并穿过该像素的光线,但要获得 3D 坐标,您还需要该像素的深度值。 考虑以下示例:大小为 S 的车辆位于距相机 d 的距离处。比相机大两倍(尺寸 2S)的类似车辆位于距相机 2d 的距离处。它们在图像上的投影完全相同。 所以你只能得到未知比例因子的 3D 位置。但是,如果您知道它们在现实世界中的大小,则可以估计每辆车的位置。