如何解释视差值

How to interpret Disparity value

假设我们有两张来自立体相机的已知像素位置的校正照片,我们想要绘制视差图

如果右边照片中的像素在两个方向上移动,那么最近的像素是多少?我知道最远点是具有最小值的点,如果我们这样做 q.x -p.x (p 是左图中的一个像素)也是这个最大值最接近?

谢谢

视差图通常用带符号的值书写,表示像素在立体对中从一个图像移动到另一个图像的方向。例如,如果您在左视图中的位置 <100,250> 有一个像素,而在右视图中相应的像素位于位置 <115,250>,那么左视图在位置 <100,250> 的视差图的值为 15。位置 <115,250> 处右视图的视差图的值为 -15。

视差图可以是多通道图像,通常是第一个通道是x-shift,第二个通道是y-shift。如果您正在查看具有大量视差的高分辨率立体对,您可能无法将所有可能的视差值都放入 8 位图像中。在电影行业中,大多数视差图都存储为 16 位或 32 位浮点图像。

不存在缩放差异的标准方法,通常不赞成使用这种方法,因为差异旨在描述 "physical/concrete/immutable/etc" 属性。然而,有时这是必要的。例如,如果您想在 8 位图像中记录大型立体对的视差,则必须缩放值以适应 8 位容器。您可以通过许多不同的方式来做到这一点。

缩放视差图的一种方法是取最大的绝对视差值并将所有值除以一个因子,该因子将把该值减小到带符号的 8 位世界中的最大值 (128)。这种方法很容易使用简单的乘法器缩小到原始视差范围,但由于除法产生的步长减少,显然会导致细节减少。例如,如果我有一个视差范围为 50 到 -200 的图像,这意味着我有 250 个可能的视差值。我可以将所有值除以 200/128 = 1.5625。这给了我 32 到 -128 或 160 个可能的视差值的范围。当我使用乘法将这些值向上缩放时,我再次得到 50 到 -200,但现在该范围内只有 160 个可能的视差值。

使用上述视差范围的另一种方法是简单地移动范围。总范围是 250,我们带符号的 8 位容器可以容纳 256 个值,所以我们从所有值中减去 250-128 = 72,得到 122 到 -128 的新范围。这使我们能够保留所有视差步骤,只需将我们的移位因子添加回图像即可获得准确的输入图像。

相反,如果您有范围为 -5 到 10 的视差图。您可能希望扩大该范围以包括子像素视差值。所以你可以将 10 放大到 128,将 -5 缩小到 -64。这提供了更广泛的值范围,但可能值的总数将根据输入差异范围在帧与帧之间发生变化。

缩放方法的问题是它们可能有损,并且每个保存的图像都会有一个缩放 factor/method 需要反转。如果每个图像都有一个单独的比例因子,那么该因子必须与图像一起存储。如果每个图像都具有相同的比例因子,那么由于可能值的减少,数据会出现更大的退化。这就是为什么以更高的位深度存储视差图以确保数据的完整性通常是一种好的做法。