非常奇怪的 OpenCL CL_OUT_OF_RESOURCES 行为

Very odd OpenCL CL_OUT_OF_RESOURCES behavior

我正在编写一个包含大量函数调用的相当大的 OpenCL 程序。我一直遇到 CL_OUT_OF_RESOURCES 错误的问题,但我设法用一个简单的 printf 语句解决了这个问题。这是有问题的代码片段:

...
const float color = raytrace(depthMap, triangles, ...tonMoreParameters...);

if (i == 1234) {
    printf("hello\n");
}

outImage[i] = color;
...

这工作正常,但如果我删除 printf 函数,程序就会崩溃。如果我把它放在里面,它就不会。 当它崩溃时,它会给出 CL_OUT_OF_RESOURCES 错误。谁能解释为什么添加 printf 会使程序 not 运行 耗尽资源?如果没有这个无用的 printf,我怎么能完成这项工作?

相关规格:

编辑:

我注意到将 printf 语句放在其他地方会改变代码的运行方式。一些 printf 语句导致程序输出不同的数值结果,而另一些则导致程序崩溃。

即使更改从未执行过的代码也会极大地改变计算。 就好像改变任何代码都会随机化它的执行方式。

这是显卡故障的迹象吗? 或者可能是 OpenCL 编译器中的错误?

编辑 2

事实证明,递归不是问题所在。我删除了所有递归调用,但 printfs 和其他无害的更改仍然会根据代码放置的位置改变代码 运行s 的方式。

这绝对是编译时的问题。

large OpenCL program with lots of function calls and recursion

OpenCL C 2.2 pdf,第 46 页:

Recursion is not supported.

我不知道为什么 printf 会改变一些东西,但你的程序依赖于一个明确不受支持的功能。

我找到了解决我自己问题的方法。

问题是由一个简单的数组越界错误引起的。显然,OpenCL 不会捕获这些类型的错误。因此,任何越界读取或写入的尝试都可能导致静默内存损坏,就像我的情况一样。损坏的内存是程序本身的指令,因此是随机的执行结果。

问题也有一部分是蘑菇提到的非法使用递归引起的。同样,OpenCL 编译器允许它悄悄破坏程序内存。

所以请小心 OpenCL 开发人员。