Tensorboard Profiler:加载 libcupti 失败(是否已安装并可访问?)

Tensorboard Profiler: Failed to load libcupti (is it installed and accessible?)

我正在尝试分析我的 tensorflow 应用程序。训练运行良好,但如果我在 Tensorboard 中打开 Profile-Tab,我会得到 Failed to load libcupti (is it installed and accessible?)

我的配置是:

CUDA_PATHC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2

我的路径变量包含:

conda list(仅相关包):

cudatoolkit               11.3.1               h59b6b97_2
cudnn                     8.2.1                cuda11.3_0
tensorboard               2.6.0                      py_1
tensorboard-data-server   0.6.0            py39haa95532_0
tensorboard-plugin-profile 2.5.0                    pypi_0    pypi
tensorboard-plugin-wit    1.6.0                      py_0
tensorflow                2.6.0           gpu_py39he88c5ba_0
tensorflow-base           2.6.0           gpu_py39hb3da07e_0
tensorflow-datasets       4.5.2                    pypi_0    pypi
tensorflow-estimator      2.6.0              pyh7b7c402_0
tensorflow-gpu            2.6.0                h17022bd_0
tensorflow-metadata       1.6.0                    pypi_0    pypi

令我惊讶的是,Anaconda 安装了 CUDA Toolkit 11.3 版和 cuDNN 8.2.1 版。 根据 GPU-configurations 这应该是版本 11.2 和 8.1。这可能是问题所在吗?

或者有人知道如何解决这个问题?

隐藏在 jupyter 的日志输出中我发现了一条错误消息:Could not load dynamic library 'cupti64_113.dll': dlerror: cupti64_113.dll not found

根据此错误消息和 that hint 我能够解决问题: 我在 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64 中复制了 cupti64_2020.3.0.dll 并将其重命名为 cupti64_113.dll 现在分析器可以工作了。