nppiResizeSqrPixel_32f_C4R() 如何运作?
How nppiResizeSqrPixel_32f_C4R() works?
上述函数在cuda中是如何进行运算的。我们是否需要将 CudaMalloc() 或 MemCopy() 与此一起编写,或者只是在内部进行所有这些调用。
我写了
nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16);
这里'in'是有输入图像的向量,'out'是一个空向量。但是执行上述函数后,输出向量仍然是 '0' 。你能指导我如何调整函数的大小吗?
它对设备数据进行操作,因此您将需要使用设备分配(例如cudaMalloc
)和将数据复制到设备(例如cudaMemcpy
)等
usual place and there are CUDA sample codes 提供了有限数量的 npp 调用文档,这些文档演示了 npp 库调用利用的一些示例。
对于这些资源未解决的问题,您可能还需要查看 intel ipp 文档。在许多情况下,npp 例程与 intel ipp 功能非常相似,因此您可能会在那里获得一些见解。 Here 是一个示例文档。
还要检查任何适当的 CUDA 或 npp 调用的 return 值,您还可以 运行 您的代码 cuda-memcheck
以获得有关可能出错的提示。
上述函数在cuda中是如何进行运算的。我们是否需要将 CudaMalloc() 或 MemCopy() 与此一起编写,或者只是在内部进行所有这些调用。
我写了
nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16);
这里'in'是有输入图像的向量,'out'是一个空向量。但是执行上述函数后,输出向量仍然是 '0' 。你能指导我如何调整函数的大小吗?
它对设备数据进行操作,因此您将需要使用设备分配(例如cudaMalloc
)和将数据复制到设备(例如cudaMemcpy
)等
usual place and there are CUDA sample codes 提供了有限数量的 npp 调用文档,这些文档演示了 npp 库调用利用的一些示例。
对于这些资源未解决的问题,您可能还需要查看 intel ipp 文档。在许多情况下,npp 例程与 intel ipp 功能非常相似,因此您可能会在那里获得一些见解。 Here 是一个示例文档。
还要检查任何适当的 CUDA 或 npp 调用的 return 值,您还可以 运行 您的代码 cuda-memcheck
以获得有关可能出错的提示。