如何从我编写的 __global__ 函数中获取 cuFunction?
How do I get a cuFunction from a __global__ function I've written?
假设我想在我编写的某些源代码上使用 CUDA 的低级驱动程序 API。我知道 cuLaunchKernel
,但我似乎无法在文档中找到关于如何将 cuFunction
从 __global__
函数传递给它的确切解释。
您使用cuModuleGetFunction。如果您不使用 C 链接,则您传递的函数名称必须是经过修饰的 C++ 名称。您可以在设备源的编译版本上使用 cuobjdump 获取它。
假设我想在我编写的某些源代码上使用 CUDA 的低级驱动程序 API。我知道 cuLaunchKernel
,但我似乎无法在文档中找到关于如何将 cuFunction
从 __global__
函数传递给它的确切解释。
您使用cuModuleGetFunction。如果您不使用 C 链接,则您传递的函数名称必须是经过修饰的 C++ 名称。您可以在设备源的编译版本上使用 cuobjdump 获取它。