如何从我编写的 __global__ 函数中获取 cuFunction?

How do I get a cuFunction from a __global__ function I've written?

假设我想在我编写的某些源代码上使用 CUDA 的低级驱动程序 API。我知道 cuLaunchKernel,但我似乎无法在文档中找到关于如何将 cuFunction__global__ 函数传递给它的确切解释。

您使用cuModuleGetFunction。如果您不使用 C 链接,则您传递的函数名称必须是经过修饰的 C++ 名称。您可以在设备源的编译版本上使用 cuobjdump 获取它。