世界中给定 Z 的 2D 到 3D 投影
2D to 3D Projection with given Z in world
很抱歉,如果之前有人问过,但我找不到正确的答案。
为了更好地理解,让我简要解释一下我的问题的背景
上下文
我有两张图片(A 和 B),上面有非平面物体。我希望能够从 A 获取像素 pA 的坐标并将其投影到 B。因为我的场景不是平面的,所以我不能使用单应性。我要做的是先将我的像素pA投影到3D世界,然后将结果投影到图像B中得到pB。
pA (2D) -> pWorld (3D) -> pB (2D)。
幸运的是,我知道pworld的坐标z。我的问题涉及第一步 pA (2D) -> pWorld (3D)。
问题
如何将我的 2D 点 pA (u,v) 投影到世界 (pWorld=(X,Y,Z)),Z 被给定?
我还有相机的外部矩阵Rt(3x4)和内部矩阵K(3x3)。
我试过的
我知道:
s*(u v 1)' = K * Rt * (X Y Z)' [1]
s 是比例尺。
但我想有相反的过程,Z 被给出。类似于:
(X Y) = SOMETHING * (u v)
我可以重写 [1] 得到
s*(u v 1/s 1/s)' = G * (X Y Z 1)'
with G = (l1 l2 l3 l4) (l表示行)
l1 = (K*Rt) 的第一行
l2 = (K*Rt)的第二行
l3 = 0 0 1/Z 0
l4 = 0 0 0 1
G是可逆的,然后我可以有
(X Y Z 1)' = inv(G) * (us vs 1 1)'
但我不能使用它,因为我不知道比例。我想我对这个规模的事情有点困惑。我知道我们通常会规范化以摆脱它,但在这里,我不能。
也许这不是继续的好方法。如果有人能告诉我好的方法,我会很高兴听到的。
提前致谢。
我找到了解决方案,但它太丑了。
让我们考虑 3x4 矩阵 M:
M = K*Rt = (mij) 1<i<3, 1<j<4
为了简化,我们还考虑系数 A 和 B:
A = (m12-m32*u)/(m22-m32v)
B = (m31*u-m11)/(m31*v-m21)
符号说明了,让我们继续系统。
正如我所说,系统是:
s*(u v 1)' = M*(X Y Z 1)'
我们有 3 个方程 和 3 个未知数 : s, X 和 Y。
我们可以注意到:
s = m31*X + m32*Y + m33*Z + m34
注意,如果你想投影到相机坐标系而不是世界坐标系(类似于没有旋转和平移的情况),你有 s = Z 这是一种更容易解决的系统(这里的例子To calculate world coordinates from screen coordinates with OpenCV)
考虑到这一点,我们可以将原始系统简化为具有 2 个方程 和 2 个未知数 的系统(X 和 Y):
然后,经过一番计算,我们最终得到:
X = [Z*((m23-M33*v)*A-m13+m33*u) + (m24-m34*v)*A-m14+m34*u ] / [A*(m31*v-m21)-m31*u+m11]
Y = [Z*((m13-m33*u)-B*(m23-m33*v)) + m14-m34*u-B*(m24-m34*v)] / [B*(m22-m32*v)-m12+m32*u]
是X、Y在u、v、Z函数中的表达式。
我用我的项目测试了它并且它正在工作。
不知道是否有更简洁的方法来计算它(使用矩阵和其他东西),但这就是我现在能想到的。
很抱歉,如果之前有人问过,但我找不到正确的答案。
为了更好地理解,让我简要解释一下我的问题的背景
上下文
我有两张图片(A 和 B),上面有非平面物体。我希望能够从 A 获取像素 pA 的坐标并将其投影到 B。因为我的场景不是平面的,所以我不能使用单应性。我要做的是先将我的像素pA投影到3D世界,然后将结果投影到图像B中得到pB。 pA (2D) -> pWorld (3D) -> pB (2D)。 幸运的是,我知道pworld的坐标z。我的问题涉及第一步 pA (2D) -> pWorld (3D)。
问题
如何将我的 2D 点 pA (u,v) 投影到世界 (pWorld=(X,Y,Z)),Z 被给定? 我还有相机的外部矩阵Rt(3x4)和内部矩阵K(3x3)。
我试过的
我知道:
s*(u v 1)' = K * Rt * (X Y Z)' [1]
s 是比例尺。 但我想有相反的过程,Z 被给出。类似于:
(X Y) = SOMETHING * (u v)
我可以重写 [1] 得到
s*(u v 1/s 1/s)' = G * (X Y Z 1)'
with G = (l1 l2 l3 l4) (l表示行)
l1 = (K*Rt) 的第一行
l2 = (K*Rt)的第二行
l3 = 0 0 1/Z 0
l4 = 0 0 0 1
G是可逆的,然后我可以有
(X Y Z 1)' = inv(G) * (us vs 1 1)'
但我不能使用它,因为我不知道比例。我想我对这个规模的事情有点困惑。我知道我们通常会规范化以摆脱它,但在这里,我不能。
也许这不是继续的好方法。如果有人能告诉我好的方法,我会很高兴听到的。
提前致谢。
我找到了解决方案,但它太丑了。
让我们考虑 3x4 矩阵 M:
M = K*Rt = (mij) 1<i<3, 1<j<4
为了简化,我们还考虑系数 A 和 B:
A = (m12-m32*u)/(m22-m32v)
B = (m31*u-m11)/(m31*v-m21)
符号说明了,让我们继续系统。 正如我所说,系统是:
s*(u v 1)' = M*(X Y Z 1)'
我们有 3 个方程 和 3 个未知数 : s, X 和 Y。 我们可以注意到:
s = m31*X + m32*Y + m33*Z + m34
注意,如果你想投影到相机坐标系而不是世界坐标系(类似于没有旋转和平移的情况),你有 s = Z 这是一种更容易解决的系统(这里的例子To calculate world coordinates from screen coordinates with OpenCV)
考虑到这一点,我们可以将原始系统简化为具有 2 个方程 和 2 个未知数 的系统(X 和 Y):
然后,经过一番计算,我们最终得到:
X = [Z*((m23-M33*v)*A-m13+m33*u) + (m24-m34*v)*A-m14+m34*u ] / [A*(m31*v-m21)-m31*u+m11]
Y = [Z*((m13-m33*u)-B*(m23-m33*v)) + m14-m34*u-B*(m24-m34*v)] / [B*(m22-m32*v)-m12+m32*u]
是X、Y在u、v、Z函数中的表达式。 我用我的项目测试了它并且它正在工作。
不知道是否有更简洁的方法来计算它(使用矩阵和其他东西),但这就是我现在能想到的。