世界中给定 Z 的 2D 到 3D 投影

Question

很抱歉，如果之前有人问过，但我找不到正确的答案。

为了更好地理解，让我简要解释一下我的问题的背景

上下文

我有两张图片（A 和 B），上面有非平面物体。我希望能够从 A 获取像素 pA 的坐标并将其投影到 B。因为我的场景不是平面的，所以我不能使用单应性。我要做的是先将我的像素pA投影到3D世界，然后将结果投影到图像B中得到pB。 pA (2D) -> pWorld (3D) -> pB (2D)。幸运的是，我知道pworld的坐标z。我的问题涉及第一步 pA (2D) -> pWorld (3D)。

问题

如何将我的 2D 点 pA (u,v) 投影到世界 (pWorld=(X,Y,Z))，Z 被给定？我还有相机的外部矩阵Rt（3x4）和内部矩阵K（3x3）。

我试过的

我知道： s*(u v 1)' = K * Rt * (X Y Z)' [1]

s 是比例尺。但我想有相反的过程，Z 被给出。类似于：

(X Y) = SOMETHING * (u v)

我可以重写 [1] 得到 s*(u v 1/s 1/s)' = G * (X Y Z 1)'

with G = (l1 l2 l3 l4) (l表示行)

l1 = (K*Rt) 的第一行

l2 = (K*Rt)的第二行

l3 = 0 0 1/Z 0

l4 = 0 0 0 1

G是可逆的，然后我可以有 (X Y Z 1)' = inv(G) * (us vs 1 1)'

但我不能使用它，因为我不知道比例。我想我对这个规模的事情有点困惑。我知道我们通常会规范化以摆脱它，但在这里，我不能。

也许这不是继续的好方法。如果有人能告诉我好的方法，我会很高兴听到的。

提前致谢。

Answer 1

我找到了解决方案，但它太丑了。

让我们考虑 3x4 矩阵 M:

M = K*Rt = (mij) 1<i<3, 1<j<4

为了简化，我们还考虑系数 A 和 B：

A = (m12-m32*u)/(m22-m32v)
B = (m31*u-m11)/(m31*v-m21)

符号说明了，让我们继续系统。正如我所说，系统是：

s*(u v 1)' = M*(X Y Z 1)'

我们有 3 个方程 和 3 个未知数 : s, X 和 Y。我们可以注意到：

s = m31*X + m32*Y + m33*Z + m34

注意，如果你想投影到相机坐标系而不是世界坐标系（类似于没有旋转和平移的情况），你有 s = Z 这是一种更容易解决的系统（这里的例子To calculate world coordinates from screen coordinates with OpenCV）

考虑到这一点，我们可以将原始系统简化为具有 2 个方程 和 2 个未知数 的系统（X 和 Y):

然后，经过一番计算，我们最终得到：

X = [Z*((m23-M33*v)*A-m13+m33*u) + (m24-m34*v)*A-m14+m34*u ] / [A*(m31*v-m21)-m31*u+m11]

Y = [Z*((m13-m33*u)-B*(m23-m33*v)) + m14-m34*u-B*(m24-m34*v)] / [B*(m22-m32*v)-m12+m32*u]

是X、Y在u、v、Z函数中的表达式。我用我的项目测试了它并且它正在工作。

不知道是否有更简洁的方法来计算它（使用矩阵和其他东西），但这就是我现在能想到的。

世界中给定 Z 的 2D 到 3D 投影

2D to 3D Projection with given Z in world

3d

camera

2d

projection

depth