从鼠标位置和深度图计算 3D 点

Compute 3D point from mouse-position and depth-map

我需要使用渲染的深度图从屏幕 space 位置计算 3D 坐标。不幸的是,使用常规光线追踪对我来说不是一个选择,因为我正在处理一个包含大约 5M 个面的几何体。

所以我想我会做以下事情:

This kind of works,但不知何故定位点总是稍微落后于物体,所以我的深度计算可能有问题。

现在详细介绍上述步骤

渲染深度图非常简单:

const depthTarget = new THREE.WebGLRenderTarget(w, h);
const depthMaterial = new THREE.MeshDepthMaterial({
  depthPacking: THREE.RGBADepthPacking
});

// in renderloop
renderer.setClearColor(0xffffff, 1);
renderer.clear();
scene.overrideMaterial = depthMaterial;
renderer.render(scene, camera, depthTarget);

在鼠标位置查找存储的颜色值:

renderer.readRenderTargetPixels(
  depthTarget, x, h - y, 1, 1, rgbaBuffer
);

并使用(改编自 packing.glsl 中的 GLSL 版本)转换回浮点数:

const v4 = new THREE.Vector4()
const unpackDownscale = 255 / 256;
const unpackFactors = new THREE.Vector4(
  unpackDownscale / (256 * 256 * 256),
  unpackDownscale / (256 * 256),
  unpackDownscale / 256,
  unpackDownscale
);

function unpackRGBAToDepth(rgbaBuffer) {
  return v4.fromArray(rgbaBuffer)
    .multiplyScalar(1 / 255)
    .dot(unpackFactors);
}

最后计算深度值(我在 examples/js/shaders/SSAOShader.js 的 readDepth() 中找到了相应的代码,我移植到了 JS):

function computeDepth() {
  const cameraFarPlusNear = cameraFar + cameraNear;
  const cameraFarMinusNear = cameraFar - cameraNear;
  const cameraCoef = 2.0 * cameraNear;

  let z = unpackRGBAToDepth(rgbaBuffer);
  return cameraCoef / (cameraFarPlusNear - z * cameraFarMinusNear);
}

现在,由于此函数 returns 值在 0..1 范围内,我认为它是 clip-space 坐标中的深度,所以我将它们转换为 "real" 单位使用:

const depth = camera.near + depth * (camera.far - camera.near);

这些计算显然略有偏差,我还没有弄清楚深度存储方式的数学和细节。 有人可以指出我犯的错误吗?

补充:我尝试过的其他东西

首先我认为应该可以在我的 unproject-call 中使用解压缩的深度值作为 z 的值,如下所示:

const x = mouseX/w * 2 - 1;
const y = -mouseY/h * 2 + 1;
const v = new THREE.Vector3(x, y, depth).unproject(camera);

然而,这也没有得到正确的坐标。

[编辑 1 2017-05-23 11:00CEST]

根据@WestLangleys 的评论,我发现 perspectiveDepthToViewZ() 函数听起来应该有帮助。用JS写的那个函数是

function perspectiveDepthToViewZ(invClipZ, near, far) {
  return (near * far) / ((far - near) * invClipZ - far);
}

但是,当使用深度图中的解压缩值调用时,结果相差几个数量级。 See here.

好的,所以。终于解决了。因此,对于遇到类似问题的每个人,这里是解决方案:

computeDepth 函数的最后一行是错误的。 packing.glsl中有一个函数perspectiveDepthToViewZ,转换成JS挺简单的:

function perspectiveDepthToViewZ(invClipZ, near, far) {
  return (near * far) / ((far - near) * invClipZ - far);
}

(我相信这是逆投影矩阵的一部分)

function computeDepth() {
  let z = unpackRGBAToDepth(rgbaBuffer);
  return perspectiveDepthToViewZ(z, camera.near, camera.far);
}

现在这将 return view-space 中点的 z 轴值。剩下要做的是将其转换回 world-space 坐标:

const setPositionFromViewZ = (function() {
  const viewSpaceCoord = new THREE.Vector3();
  const projInv = new THREE.Matrix4();

  return function(position, viewZ) {
    projInv.getInverse(camera.projectionMatrix);
    position
      .set(
        mousePosition.x / windowWidth * 2 - 1,
        -(mousePosition.y / windowHeight) * 2 + 1,
        0.5
      )
      .applyMatrix4(projInv);

    position.multiplyScalar(viewZ / position.z);
    position.applyMatrix4(camera.matrixWorld);
  };
}) ();