运动结构中的正交和透视相机模型有何不同？

How do orthographic and perspective camera models in structure from motion differ from each other?

在相机模型是正交的假设下，正交和透视相机模型在运动结构中如何？

此外，这些技术之间有何不同？

要理解为什么选择每种方法，我们需要查看相机的模型，当我们将其建模为正交模型和将其建模为透视图时。

正射相机模型是一个特例，我们假设场景到投影中心的距离是无限大的。这意味着我们假设物体和图像之间的距离不会造成任何失真。因此，我们希望在现实世界和图像中的对象坐标之间获得同一性。

例如，如果我们在现实世界中有一个坐标为 (X1,Y1,Z1) ,(X2,Y2,Z2), (X3,Y3,Z3) 的三角形，我们希望在图像 (x1,y1),(x2,y2),(x3,y3) 是 X1=wx1 X2=wx2 .. Y1=w*y1.. 等等。其中 w 是一些比例因子。

什么时候这是一个好的假设？请注意，我没有考虑每个点的 Z 值。所以当我们观察场景与相机的距离几乎恒定的场景时，这个假设是好的。

注意：这是一个非常简单的解释，没有考虑很多其他因素，例如相机本身的镜头畸变等等。

假设您有一个静态场景和移动相机（或等效地，刚性移动场景和静态相机）并且您想要从两个或更多图像重建场景几何和相机运动。重建通常基于获得点对应关系，也就是说，你有一些方程式，应该为点和相机运动求解这些方程式。

解决方案可以基于非线性最小化或各种近似值。相机可以通过正交投影或透视投影来近似。在最简单的 SFM 情况下，相机可以通过正交投影（或更一般地通过弱透视投影）来近似，其中场景可以按比例恢复。但由于正交投影的特性，垂直于图像平面的平移永远无法恢复。

较新的 SfM 方法使用透视投影，因为使用正交投影我们无法恢复所有信息。通过全透视投影，我们可以恢复例如沿光轴的平移。那就是几何和全运动可以恢复到全局比例因子。