从 2D 图像定位 3D 对象

3D object localization from 2D image

opencv
object-detection
python-3.x

我有一张 2D 图像，其中的车辆由 2D 边界框定位。我还有 3x3 单应矩阵和相机校准的重投影误差。这些信息是否足以找到车辆的 3D 位置？

这是我在这里的第一个问题，所以如果我需要提供更多信息，请告诉我。

无法从 2D 图像获取 3D 坐标。您可以将每个像素映射到来自相机节点并穿过该像素的光线，但要获得 3D 坐标，您还需要该像素的深度值。考虑以下示例：大小为 S 的车辆位于距相机 d 的距离处。比相机大两倍（尺寸 2S）的类似车辆位于距相机 2d 的距离处。它们在图像上的投影完全相同。所以你只能得到未知比例因子的 3D 位置。但是，如果您知道它们在现实世界中的大小，则可以估计每辆车的位置。

从 2D 图像定位 3D 对象

3D object localization from 2D image

opencv

object-detection

python-3.x