Tensorboard Profiler:加载 libcupti 失败(是否已安装并可访问?)
Tensorboard Profiler: Failed to load libcupti (is it installed and accessible?)
我正在尝试分析我的 tensorflow 应用程序。训练运行良好,但如果我在 Tensorboard 中打开 Profile-Tab,我会得到 Failed to load libcupti (is it installed and accessible?)
。
我的配置是:
- Windows10
- Python 3.9.7
- 张量流 2.6.0
- CUDA 工具包 11.2
- cuDNN 8.1.1(按照描述复制文件安装为 here)
- Visual Studio 专业 2019
CUDA_PATH
是 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2
我的路径变量包含:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\libnvvp
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\include
C:\Program Files\NVIDIA Corporation\Nsight Systems 2020.4.3\target-windows-x64
conda list
(仅相关包):
cudatoolkit 11.3.1 h59b6b97_2
cudnn 8.2.1 cuda11.3_0
tensorboard 2.6.0 py_1
tensorboard-data-server 0.6.0 py39haa95532_0
tensorboard-plugin-profile 2.5.0 pypi_0 pypi
tensorboard-plugin-wit 1.6.0 py_0
tensorflow 2.6.0 gpu_py39he88c5ba_0
tensorflow-base 2.6.0 gpu_py39hb3da07e_0
tensorflow-datasets 4.5.2 pypi_0 pypi
tensorflow-estimator 2.6.0 pyh7b7c402_0
tensorflow-gpu 2.6.0 h17022bd_0
tensorflow-metadata 1.6.0 pypi_0 pypi
令我惊讶的是,Anaconda 安装了 CUDA Toolkit 11.3 版和 cuDNN 8.2.1 版。
根据 GPU-configurations 这应该是版本 11.2 和 8.1。这可能是问题所在吗?
或者有人知道如何解决这个问题?
隐藏在 jupyter 的日志输出中我发现了一条错误消息:Could not load dynamic library 'cupti64_113.dll': dlerror: cupti64_113.dll not found
根据此错误消息和 that hint 我能够解决问题:
我在 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64
中复制了 cupti64_2020.3.0.dll
并将其重命名为 cupti64_113.dll
现在分析器可以工作了。
我正在尝试分析我的 tensorflow 应用程序。训练运行良好,但如果我在 Tensorboard 中打开 Profile-Tab,我会得到 Failed to load libcupti (is it installed and accessible?)
。
我的配置是:
- Windows10
- Python 3.9.7
- 张量流 2.6.0
- CUDA 工具包 11.2
- cuDNN 8.1.1(按照描述复制文件安装为 here)
- Visual Studio 专业 2019
CUDA_PATH
是 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2
我的路径变量包含:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\libnvvp
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\include
C:\Program Files\NVIDIA Corporation\Nsight Systems 2020.4.3\target-windows-x64
conda list
(仅相关包):
cudatoolkit 11.3.1 h59b6b97_2
cudnn 8.2.1 cuda11.3_0
tensorboard 2.6.0 py_1
tensorboard-data-server 0.6.0 py39haa95532_0
tensorboard-plugin-profile 2.5.0 pypi_0 pypi
tensorboard-plugin-wit 1.6.0 py_0
tensorflow 2.6.0 gpu_py39he88c5ba_0
tensorflow-base 2.6.0 gpu_py39hb3da07e_0
tensorflow-datasets 4.5.2 pypi_0 pypi
tensorflow-estimator 2.6.0 pyh7b7c402_0
tensorflow-gpu 2.6.0 h17022bd_0
tensorflow-metadata 1.6.0 pypi_0 pypi
令我惊讶的是,Anaconda 安装了 CUDA Toolkit 11.3 版和 cuDNN 8.2.1 版。 根据 GPU-configurations 这应该是版本 11.2 和 8.1。这可能是问题所在吗?
或者有人知道如何解决这个问题?
隐藏在 jupyter 的日志输出中我发现了一条错误消息:Could not load dynamic library 'cupti64_113.dll': dlerror: cupti64_113.dll not found
根据此错误消息和 that hint 我能够解决问题:
我在 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64
中复制了 cupti64_2020.3.0.dll
并将其重命名为 cupti64_113.dll
现在分析器可以工作了。