OpenCl 内核 returns 非常大的数字

OpenCl kernel returns strangely huge numbers

一段时间以来,我一直在尝试将我的 Marching Cubes 算法从 CPU 转移到具有 OpenCL 内核的 GPU。

我遇到的问题是我内核中的一个函数 return 有奇怪的值,所以我写了一个测试用例,在其中指定了 12 个 float3 数组中可能的 return 值float3 组件为 0、0.5 和 1(请参见下面的代码)

出于某种原因,我得到的数字非常大,例如“11”的 edgeIndex returns float3:(-145085952., 6.600e-43#DEN, 0) 而它应该是 (1, 0, 0.5)。据我所知,y 坐标基本上是 0,所以这不是问题,但 x 坐标让我头疼。

起初我认为 OpenCL 可能在将给定值转换为 float3 时遇到问题,所以我用“.f”指定它们(例如 (float3)(0.f, 0.5f, 0.f )).这只会导致更加奇怪和不同的结果,这让我觉得我必须在某个地方犯错误。 我是 OpenCL 的新手(这是我使用它的第一个真正的项目)而且我一般编程也没有那么长时间所以我希望我不会在这里犯一些新手错误但我试图解决这个问题和相关问题好几天了,我找不到解决办法。

我尽可能地缩小了问题的范围,并测试了代码是否在执行它所采取的每个步骤时都在做它应该做的事情。直到 "CalculateEdgePos" 的函数调用为止,一切似乎都很顺利,我得到了预期的结果。我删除了所有不必要代码的功能(因此您可以忽略 "values" 参数,因为它现在没有被使用)但现在我束手无策。

函数 return 奇怪的结果:

float3 CalculateEdgePos(int edgeIndex, __global int* values) 
{ 
    if(edgeIndex == -1) 
    { 
        return (float3)(-1,-1,-1); 
    } 

        float3 EdgePositions[12] = {(float3)(0, 0.5, 0), (float3)(0.5, 1, 0), (float3)(1, 0.5, 0), (float3)(0.5, 0, 0), (float3)(0, 0.5, 1), (float3)(0.5, 1, 1), (float3)(1, 0.5, 1), (float3)(0.5, 0, 1), (float3)(0, 0, 0.5), (float3)(0, 1, 0.5), (float3)(1, 1, 0.5), (float3)(1, 0, 0.5)};

        return EdgePositions[edgeIndex];
} 


and the part of the kernel with the function call and the result getting send back to the CPU 
(edgeIndex is calculated fine beforehand):

__kernel void MarchCubes(__global float* outVertices, __global int* values, __global int* edges) 
{ 
.
.
.
    float3 vertexPos = CalculateEdgePos(edgeIndex, values); 
    float coords[3] = {vertexPos.x, vertexPos.y, vertexPos.z}; 

    outVertices[get_global_id(0)] = coords[coordIndex]; 
}

如果你们中的任何人可以提供任何提示或帮助,我将不胜感激。 如果您需要更多代码片段,请告诉我,但我认为这应该足够了,因为它只是指定的函数表现得很奇怪。

亲切的问候, 美食家

当然,在我 post 这个困扰我很久的问题之后,我找到了解决方案...

所以如果有人有类似的问题:

OpenCL 似乎真的不喜欢在数组本身的声明中正确声明数组元素。 所以不要写:

 float3 EdgePositions[12] = {(float3)(0, 0.5, 0), (float3)(0.5, 1, 0), (float3)(1, 0.5, 0), (float3)(0.5, 0, 0), (float3)(0, 0.5, 1), (float3)(0.5, 1, 1), (float3)(1, 0.5, 1), (float3)(0.5, 0, 1), (float3)(0, 0, 0.5), (float3)(0, 1, 0.5), (float3)(1, 1, 0.5), (float3)(1, 0, 0.5)};

我现在写道:

float3 pos0 = (float3)(0.f, 0.5f, 0.f);
    float3 pos1 = (float3)(0.5f, 1.f, 0.f);
    float3 pos2 = (float3)(1.f, 0.5f, 0.f);
    float3 pos3 = (float3)(0.5f, 0.f, 0.f);
    float3 pos4 = (float3)(0.f, 0.5f, 1.f);
    float3 pos5 = (float3)(0.5f, 1.f, 1.f);
    float3 pos6 = (float3)(1.f, 0.5f, 1.f);
    float3 pos7 = (float3)(0.5f, 0.f, 1.f);
    float3 pos8 = (float3)(0.f, 0.f, 0.5f);
    float3 pos9 = (float3)(0.f, 1.f, 0.5f);
    float3 pos10 = (float3)(1.f, 1.f, 0.5f);
    float3 pos11 = (float3)(1.f, 0.f, 0.5f);

    float3 EdgePositions[12] = {pos0, pos1, pos2, pos3, pos4, pos5, pos6, pos7, pos8, pos9, pos10, pos11};

现在它就像一个魅力。

我仍然不明白为什么不允许这样做或 returns 错误值,所以如果有人知道并愿意详细说明,我将非常感激。