GLSL 计算着色器闪烁 blocks/squares 神器
GLSL compute shader flickering blocks/squares artifact
我正在尝试使用 OpenGL 中的计算着色器编写一个最低限度的 GPU 光线投射器。我相信光线投射本身是有效的,因为我已经通过光线盒相交算法获得了清晰的边界框轮廓。
但是,在尝试光线-三角形相交时,我得到了奇怪的伪像。我的着色器被编程为简单地测试光线-三角形交叉点,如果发现交叉点则将像素着色为白色,否则为黑色。而不是预期的行为,当三角形应该在屏幕上可见时,屏幕会充满黑色和白色 squares/blocks/tiles,像电视静态一样随机闪烁。正方形最多为 8x8 像素(我的计算着色器块的大小),尽管也有小到单个像素的点。白色块通常位于三角形的预期区域,但有时它们也会散布在屏幕底部。
Here is a video of the artifact。在我的完整着色器中,相机可以旋转并且形状看起来更像三角形,但闪烁的伪像是关键问题并且仍然出现在我从以下最小版本的着色器代码生成的视频中:
layout(local_size_x = 8, local_size_y = 8, local_size_z = 1) in;
uvec2 DIMS = gl_NumWorkGroups.xy*gl_WorkGroupSize.xy;
uvec2 UV = gl_GlobalInvocationID.xy;
vec2 uvf = vec2(UV) / vec2(DIMS);
layout(location = 1, rgba8) uniform writeonly image2D brightnessOut;
struct Triangle
{
vec3 v0;
vec3 v1;
vec3 v2;
};
struct Ray
{
vec3 origin;
vec3 direction;
vec3 inv;
};
// Wikipedia Moller-Trumbore algorithm, GLSL-ified
bool ray_triangle_intersection(vec3 rayOrigin, vec3 rayVector,
in Triangle inTriangle, out vec3 outIntersectionPoint)
{
const float EPSILON = 0.0000001;
vec3 vertex0 = inTriangle.v0;
vec3 vertex1 = inTriangle.v1;
vec3 vertex2 = inTriangle.v2;
vec3 edge1 = vec3(0.0);
vec3 edge2 = vec3(0.0);
vec3 h = vec3(0.0);
vec3 s = vec3(0.0);
vec3 q = vec3(0.0);
float a = 0.0, f = 0.0, u = 0.0, v = 0.0;
edge1 = vertex1 - vertex0;
edge2 = vertex2 - vertex0;
h = cross(rayVector, edge2);
a = dot(edge1, h);
// Test if ray is parallel to this triangle.
if (a > -EPSILON && a < EPSILON)
{
return false;
}
f = 1.0/a;
s = rayOrigin - vertex0;
u = f * dot(s, h);
if (u < 0.0 || u > 1.0)
{
return false;
}
q = cross(s, edge1);
v = f * dot(rayVector, q);
if (v < 0.0 || u + v > 1.0)
{
return false;
}
// At this stage we can compute t to find out where the intersection point is on the line.
float t = f * dot(edge2, q);
if (t > EPSILON) // ray intersection
{
outIntersectionPoint = rayOrigin + rayVector * t;
return true;
}
return false;
}
void main()
{
// Generate rays by calculating the distance from the eye
// point to the screen and combining it with the pixel indices
// to produce a ray through this invocation's pixel
const float HFOV = (3.14159265359/180.0)*45.0;
const float WIDTH_PX = 1280.0;
const float HEIGHT_PX = 720.0;
float VIEW_PLANE_D = (WIDTH_PX/2.0)/tan(HFOV/2.0);
vec2 rayXY = vec2(UV) - vec2(WIDTH_PX/2.0, HEIGHT_PX/2.0);
// Rays have origin at (0, 0, 20) and generally point towards (0, 0, -1)
Ray r;
r.origin = vec3(0.0, 0.0, 20.0);
r.direction = normalize(vec3(rayXY, -VIEW_PLANE_D));
r.inv = 1.0 / r.direction;
// Triangle in XY plane at Z=0
Triangle debugTri;
debugTri.v0 = vec3(-20.0, 0.0, 0.0);
debugTri.v1 = vec3(20.0, 0.0, 0.0);
debugTri.v0 = vec3(0.0, 40.0, 0.0);
// Test triangle intersection; write 1.0 if hit, else 0.0
vec3 hitPosDebug = vec3(0.0);
bool hitDebug = ray_triangle_intersection(r.origin, r.direction, debugTri, hitPosDebug);
imageStore(brightnessOut, ivec2(UV), vec4(vec3(float(hitDebug)), 1.0));
}
我使用法线 sampler2D
和选择映射到屏幕的光栅化三角形 UV 将图像渲染为全屏三角形 space。
None 这段代码应该是时间相关的,我已经尝试了来自各种来源的多种射线三角算法,包括分支和无分支版本,并且都表现出相同的问题,这让我怀疑某种我不熟悉的内存不一致行为,驱动程序问题,或者我在配置或调度我的计算时犯的错误(我调度我的 8x8x1 块中的 160x90x1 来覆盖我的 1280x720 帧缓冲区纹理)。
我在 SE 和一般互联网上发现了一些类似的问题,例如 this one,但它们似乎几乎完全是由使用未初始化的变量引起的,据我所知我并没有这样做.他们提到在 NSight 调试器中查看时,模式会继续移动;虽然 RenderDoc 不这样做,但即使在计算着色器完成后,图像的内容 do 在绘制调用之间也会有所不同。例如。在计算绘制调用中检查图像时,存在一种伪影模式,但是当我擦洗到使用我的图像作为输入的后续绘制调用时,图像中的模式已经改变,尽管没有写入图像。
我还发现 this post 看起来非常相似,但那个似乎也是由未初始化的变量引起的,我再次小心避免。我也无法像他们那样通过调整代码来缓解这个问题。
post 有一个外观相似的工件,这是一个内存模型问题,但我没有使用任何共享内存。
我是 GTX 1070 上的 运行 最新 NVidia 驱动程序 (461.92)。我尝试在我的计算着色器之后插入 glMemoryBarrier(GL_TEXTURE_FETCH_BARRIER_BIT);
(以及其他一些屏障类型)如果使用 sampler2D
绘制先前由图像 load/store 操作修改过的纹理,我认为 dispatch 是正确的障碍,但它似乎没有改变任何东西。
我刚刚尝试在调度调用之前和之后用 glMemoryBarrier(GL_ALL_BARRIER_BITS);
重新 运行 它,所以同步似乎不是问题。
很可能问题的原因出在我的椅子和键盘之间,但由于我对 OpenGL 比较陌生,所以这种问题不在我通常的着色器调试能力范围内。任何想法,将不胜感激!谢谢。
我已经解决了这个问题,这(不出所料)只是我自己的一个愚蠢错误。
观察我的代码片段中的以下几行:
这让我的 v2
顶点完全未初始化。
这个故事的寓意是,如果您遇到与我上面描述的问题类似的问题,并且发誓您已经初始化了所有变量,那一定是驱动程序错误或其他人的错...四重检查你的变量,你可能忘了初始化一个。
我正在尝试使用 OpenGL 中的计算着色器编写一个最低限度的 GPU 光线投射器。我相信光线投射本身是有效的,因为我已经通过光线盒相交算法获得了清晰的边界框轮廓。
但是,在尝试光线-三角形相交时,我得到了奇怪的伪像。我的着色器被编程为简单地测试光线-三角形交叉点,如果发现交叉点则将像素着色为白色,否则为黑色。而不是预期的行为,当三角形应该在屏幕上可见时,屏幕会充满黑色和白色 squares/blocks/tiles,像电视静态一样随机闪烁。正方形最多为 8x8 像素(我的计算着色器块的大小),尽管也有小到单个像素的点。白色块通常位于三角形的预期区域,但有时它们也会散布在屏幕底部。
Here is a video of the artifact。在我的完整着色器中,相机可以旋转并且形状看起来更像三角形,但闪烁的伪像是关键问题并且仍然出现在我从以下最小版本的着色器代码生成的视频中:
layout(local_size_x = 8, local_size_y = 8, local_size_z = 1) in;
uvec2 DIMS = gl_NumWorkGroups.xy*gl_WorkGroupSize.xy;
uvec2 UV = gl_GlobalInvocationID.xy;
vec2 uvf = vec2(UV) / vec2(DIMS);
layout(location = 1, rgba8) uniform writeonly image2D brightnessOut;
struct Triangle
{
vec3 v0;
vec3 v1;
vec3 v2;
};
struct Ray
{
vec3 origin;
vec3 direction;
vec3 inv;
};
// Wikipedia Moller-Trumbore algorithm, GLSL-ified
bool ray_triangle_intersection(vec3 rayOrigin, vec3 rayVector,
in Triangle inTriangle, out vec3 outIntersectionPoint)
{
const float EPSILON = 0.0000001;
vec3 vertex0 = inTriangle.v0;
vec3 vertex1 = inTriangle.v1;
vec3 vertex2 = inTriangle.v2;
vec3 edge1 = vec3(0.0);
vec3 edge2 = vec3(0.0);
vec3 h = vec3(0.0);
vec3 s = vec3(0.0);
vec3 q = vec3(0.0);
float a = 0.0, f = 0.0, u = 0.0, v = 0.0;
edge1 = vertex1 - vertex0;
edge2 = vertex2 - vertex0;
h = cross(rayVector, edge2);
a = dot(edge1, h);
// Test if ray is parallel to this triangle.
if (a > -EPSILON && a < EPSILON)
{
return false;
}
f = 1.0/a;
s = rayOrigin - vertex0;
u = f * dot(s, h);
if (u < 0.0 || u > 1.0)
{
return false;
}
q = cross(s, edge1);
v = f * dot(rayVector, q);
if (v < 0.0 || u + v > 1.0)
{
return false;
}
// At this stage we can compute t to find out where the intersection point is on the line.
float t = f * dot(edge2, q);
if (t > EPSILON) // ray intersection
{
outIntersectionPoint = rayOrigin + rayVector * t;
return true;
}
return false;
}
void main()
{
// Generate rays by calculating the distance from the eye
// point to the screen and combining it with the pixel indices
// to produce a ray through this invocation's pixel
const float HFOV = (3.14159265359/180.0)*45.0;
const float WIDTH_PX = 1280.0;
const float HEIGHT_PX = 720.0;
float VIEW_PLANE_D = (WIDTH_PX/2.0)/tan(HFOV/2.0);
vec2 rayXY = vec2(UV) - vec2(WIDTH_PX/2.0, HEIGHT_PX/2.0);
// Rays have origin at (0, 0, 20) and generally point towards (0, 0, -1)
Ray r;
r.origin = vec3(0.0, 0.0, 20.0);
r.direction = normalize(vec3(rayXY, -VIEW_PLANE_D));
r.inv = 1.0 / r.direction;
// Triangle in XY plane at Z=0
Triangle debugTri;
debugTri.v0 = vec3(-20.0, 0.0, 0.0);
debugTri.v1 = vec3(20.0, 0.0, 0.0);
debugTri.v0 = vec3(0.0, 40.0, 0.0);
// Test triangle intersection; write 1.0 if hit, else 0.0
vec3 hitPosDebug = vec3(0.0);
bool hitDebug = ray_triangle_intersection(r.origin, r.direction, debugTri, hitPosDebug);
imageStore(brightnessOut, ivec2(UV), vec4(vec3(float(hitDebug)), 1.0));
}
我使用法线 sampler2D
和选择映射到屏幕的光栅化三角形 UV 将图像渲染为全屏三角形 space。
None 这段代码应该是时间相关的,我已经尝试了来自各种来源的多种射线三角算法,包括分支和无分支版本,并且都表现出相同的问题,这让我怀疑某种我不熟悉的内存不一致行为,驱动程序问题,或者我在配置或调度我的计算时犯的错误(我调度我的 8x8x1 块中的 160x90x1 来覆盖我的 1280x720 帧缓冲区纹理)。
我在 SE 和一般互联网上发现了一些类似的问题,例如 this one,但它们似乎几乎完全是由使用未初始化的变量引起的,据我所知我并没有这样做.他们提到在 NSight 调试器中查看时,模式会继续移动;虽然 RenderDoc 不这样做,但即使在计算着色器完成后,图像的内容 do 在绘制调用之间也会有所不同。例如。在计算绘制调用中检查图像时,存在一种伪影模式,但是当我擦洗到使用我的图像作为输入的后续绘制调用时,图像中的模式已经改变,尽管没有写入图像。
我还发现 this post 看起来非常相似,但那个似乎也是由未初始化的变量引起的,我再次小心避免。我也无法像他们那样通过调整代码来缓解这个问题。
我是 GTX 1070 上的 运行 最新 NVidia 驱动程序 (461.92)。我尝试在我的计算着色器之后插入 glMemoryBarrier(GL_TEXTURE_FETCH_BARRIER_BIT);
(以及其他一些屏障类型)如果使用 sampler2D
绘制先前由图像 load/store 操作修改过的纹理,我认为 dispatch 是正确的障碍,但它似乎没有改变任何东西。
我刚刚尝试在调度调用之前和之后用 glMemoryBarrier(GL_ALL_BARRIER_BITS);
重新 运行 它,所以同步似乎不是问题。
很可能问题的原因出在我的椅子和键盘之间,但由于我对 OpenGL 比较陌生,所以这种问题不在我通常的着色器调试能力范围内。任何想法,将不胜感激!谢谢。
我已经解决了这个问题,这(不出所料)只是我自己的一个愚蠢错误。
观察我的代码片段中的以下几行:
这让我的 v2
顶点完全未初始化。
这个故事的寓意是,如果您遇到与我上面描述的问题类似的问题,并且发誓您已经初始化了所有变量,那一定是驱动程序错误或其他人的错...四重检查你的变量,你可能忘了初始化一个。