3D 激光雷达点在第 i 个相机图像中的投影(KITTI 数据集)

Projection of 3D Lidar point in the i-th camera image (KITTI Dataset)

我正在处理一个对象分类问题,我正在使用来自 Kitti 数据集的激光雷达和相机数据。, 在这篇文章中:http://ww.cvlibs.net/publications/Geiger2013IJRR.pdf,他们提供了将 3d PointCloud 投影到第 i 个相机图像平面的公式,但有些东西我不明白:

以下等式((3) :

如果3D点X在velodyne相机图像中,Y在第i个相机图像中,为什么X有四个坐标,Y有三个?应该是3和2吧?


(来源:noelshack.com

我需要将 3D 点云投影到相机图像平面,然后创建激光雷达图像以将它们用作 CNN 的通道。有人对此有想法吗?

提前致谢

对于您关于 x 和 y 维度的第一个查询,有两种解释。

理由一.

  • For image re-projection使用的针孔相机型号是 透视坐标或齐次坐标。看法 投影使用图像原点作为投影和点的中心 被映射到平面 z=1。表示一个 3D 点 [x y z] 通过[xw yw zw w]表示它在平面上映射的点 通过 [xw yw zw]. 用 w 归一化给出。

    所以 (x,y) -> [x y 1]T : 均匀图像坐标

    and (x,y,z) -> [x y z 1] T : 均匀场景坐标

理由二

  • 关于您所附的论文,考虑等式 (4) 和 (5)

    很明显P是3X4维度,R展开为4x4dimension.Alsox是1x4维度。因此,根据矩阵乘法规则,第一个矩阵的列数必须等于第二个矩阵的行数。所以对于给定 3x4 的 P 和 4x4 的 R,x 必须是 1x4.

现在进入你的第二个问题,激光雷达图像融合,它需要内参和外参(相对旋转和平移)和相机矩阵。这种旋转和平移形成一个 3x4 矩阵,称为变换矩阵。所以点融合方程变成

[x y 1]^T = Transformation Matrix * Camera Matrix * [X Y Z 1]^T

也可以参考:: Lidar Image Fusion KITTI

完成 LiDAR 图像融合后,您可以将此图像输入 CNN model.I 我不知道用于 LiDAR 融合图像的 DNN 模块。

希望这对您有所帮助..