从 Python 内核调用 C++ CUDA 设备函数

Calling a C++ CUDA device function from a Python kernel

我正在从事一个涉及在 Python 中创建 CUDA 内核的项目。 Numba 工作得很好(这些人所取得的成就令人难以置信),PyCUDA 也是如此。

我的问题是我想从 Python 生成的内核中调用 C 设备函数。我找不到方法来完成这个。 Numba 可以调用 CFFI 模块,但只能在 CPU 代码中调用。在 PyCUDA 中,我可以将我的 C 设备函数添加到 SourceModule,但我不知道如何包含另一个库中已经存在的函数。

有没有办法做到这一点?

据我所知,这在任何一种语言中都是不可能的。既没有为单独的编译公开必要的工具链控件,也没有公开 API 来执行设备代码的运行时链接。