运动结构中的正交和透视相机模型有何不同?

How do orthographic and perspective camera models in structure from motion differ from each other?

在相机模型是正交的假设下,正交和透视相机模型在运动结构中如何?

此外,这些技术之间有何不同?

要理解为什么选择每种方法,我们需要查看相机的模型,当我们将其建模为正交模型和将其建模为透视图时。

正射相机模型是一个特例,我们假设场景到投影中心的距离是无限大的。这意味着我们假设物体和图像之间的距离不会造成任何失真。因此,我们希望在现实世界和图像中的对象坐标之间获得同一性。

例如,如果我们在现实世界中有一个坐标为 (X1,Y1,Z1) ,(X2,Y2,Z2), (X3,Y3,Z3) 的三角形,我们希望在图像 (x1,y1),(x2,y2),(x3,y3) 是 X1=wx1 X2=wx2 .. Y1=w*y1.. 等等。其中 w 是一些比例因子。

什么时候这是一个好的假设?请注意,我没有考虑每个点的 Z 值。所以当我们观察场景与相机的距离几乎恒定的场景时,这个假设是好的。

注意:这是一个非常简单的解释,没有考虑很多其他因素,例如相机本身的镜头畸变等等。

假设您有一个静态场景和移动相机(或等效地,刚性移动场景和静态相机)并且您想要从两个或更多图像重建场景几何和相机运动。重建通常基于获得点对应关系,也就是说,你有一些方程式,应该为点和相机运动求解这些方程式。

解决方案可以基于非线性最小化或各种近似值。相机可以通过正交投影或透视投影来近似。在最简单的 SFM 情况下,相机可以通过正交投影(或更一般地通过弱透视投影)来近似,其中场景可以按比例恢复。但由于正交投影的特性,垂直于图像平面的平移永远无法恢复。

较新的 SfM 方法使用透视投影,因为使用正交投影我们无法恢复所有信息。通过全透视投影,我们可以恢复例如沿光轴的平移。那就是几何和全运动可以恢复到全局比例因子。