无法在 Turing GPU 上使用 Nsight 在内核内部设置断点

Cannot hit breakpoints inside kernel using Nsight on a Turing GPU

我的电脑设置是:

OS: Windows 10

IDE:Visual Studio 2019(和 2015)

GPU:Quadro 4000 RTX

NVIDIA驱动包:441.22 Drivers for use with the CUDA Toolkit 10.2,包括Nsight 2019.4

我打开了一个名为"matrixMul"的CUDA示例项目,并在内核中设置了断点

template <int BLOCK_SIZE> __global__ void MatrixMulCUDA(float *C, float *A,
                                                        float *B, int wA,
                                                        int wB)

但是,如果我 "Start CUDA Debbugging (Next-Gen)",我会收到错误消息 "Could not initialize driver for the specified CUDA Debugger. Debugging has been automatically stopped."

如果我 "Start CUDA Debbugging (Legacy)",我收到错误消息“在旧版 CUDA 调试器不支持的 GPU 上创建了 CUDA 上下文。断点将被禁用。请参阅输出 window细节。 ".

我现在很困惑。在使用 Nsight 6.5 进行旧版调试时,我以前从未遇到过这样的问题。

请指教

正如评论中指出的那样,如果此卡未设置为 TCC 模式,则无法使用下一代调试(所有图灵卡都支持)在 Windows 中用于 CUDA 调试。

我的解决办法是,我在我的计算机上添加了另一张 NVIDIA 显卡专用于显示,因此我的 Quadro 4000 RTX 可以专注于计算(TCC 模式)。它现在完美运行。