nppiResizeSqrPixel_32f_C4R() 如何运作?

How nppiResizeSqrPixel_32f_C4R() works?

上述函数在cuda中是如何进行运算的。我们是否需要将 CudaMalloc() 或 MemCopy() 与此一起编写,或者只是在内部进行所有这些调用。

我写了

nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16);

这里'in'是有输入图像的向量,'out'是一个空向量。但是执行上述函数后,输出向量仍然是 '0' 。你能指导我如何调整函数的大小吗?

它对设备数据进行操作,因此您将需要使用设备分配(例如cudaMalloc)和将数据复制到设备(例如cudaMemcpy)等

usual place and there are CUDA sample codes 提供了有限数量的 npp 调用文档,这些文档演示了 npp 库调用利用的一些示例。

对于这些资源未解决的问题,您可能还需要查看 intel ipp 文档。在许多情况下,npp 例程与 intel ipp 功能非常相似,因此您可能会在那里获得一些见解。 Here 是一个示例文档。

还要检查任何适当的 CUDA 或 npp 调用的 return 值,您还可以 运行 您的代码 cuda-memcheck 以获得有关可能出错的提示。