3D 激光雷达点在第 i 个相机图像中的投影（KITTI 数据集）

Question

我正在处理一个对象分类问题，我正在使用来自 Kitti 数据集的激光雷达和相机数据。, 在这篇文章中：http://ww.cvlibs.net/publications/Geiger2013IJRR.pdf，他们提供了将 3d PointCloud 投影到第 i 个相机图像平面的公式，但有些东西我不明白：

以下等式((3) :

如果3D点X在velodyne相机图像中，Y在第i个相机图像中，为什么X有四个坐标，Y有三个？应该是3和2吧？

_{（来源：noelshack.com）}

我需要将 3D 点云投影到相机图像平面，然后创建激光雷达图像以将它们用作 CNN 的通道。有人对此有想法吗？

提前致谢

Answer 1

对于您关于 x 和 y 维度的第一个查询，有两种解释。

理由一.

For image re-projection使用的针孔相机型号是透视坐标或齐次坐标。看法投影使用图像原点作为投影和点的中心被映射到平面 z=1。表示一个 3D 点 [x y z] 通过[xw yw zw w]表示它在平面上映射的点通过 [xw yw zw]. 用 w 归一化给出。

所以 (x,y) -> [x y 1]^T : 均匀图像坐标

and (x,y,z) -> [x y z 1] ^T : 均匀场景坐标

理由二

关于您所附的论文，考虑等式 (4) 和 (5)

很明显P是3X4维度，R展开为4x4dimension.Alsox是1x4维度。因此，根据矩阵乘法规则，第一个矩阵的列数必须等于第二个矩阵的行数。所以对于给定 3x4 的 P 和 4x4 的 R，x 必须是 1x4.

现在进入你的第二个问题，激光雷达图像融合，它需要内参和外参（相对旋转和平移）和相机矩阵。这种旋转和平移形成一个 3x4 矩阵，称为变换矩阵。所以点融合方程变成

[x y 1]^T = Transformation Matrix * Camera Matrix * [X Y Z 1]^T

也可以参考:: Lidar Image Fusion KITTI

完成 LiDAR 图像融合后，您可以将此图像输入 CNN model.I 我不知道用于 LiDAR 融合图像的 DNN 模块。

希望这对您有所帮助..

3D 激光雷达点在第 i 个相机图像中的投影（KITTI 数据集）

Projection of 3D Lidar point in the i-th camera image (KITTI Dataset)

coordinates

lidar

projection-matrix

kitti