将 TensorFlow 与 GPU 一起使用需要很长时间才能加载与 CUDA 相关的库
Using TensorFlow with GPU taking a long time for loading library related to CUDA
机器设置:
显卡:GeForce RTX 3060
驱动版本:460.73.01
CUDA 驱动程序版本:11.2
Tensorflow:tensorflow-gpu 1.14.0
CUDA 运行时版本:10.0
cudnn: 7.4.1
注:
- CUDA Runtime 和 cudnn 版本符合 Tensorflow 官方文档中的指南。
- 我也试过TensorFlow-gpu = 2.0,还是一样的问题
问题:
我正在使用 Tensorflow 执行异议检测任务。我的情况是程序会卡在
2021-06-05 12:16:54.099778: I tensorflow/stream_executor/platform/default/dso_loader.cc:42] Successfully opened dynamic library libcublas.so.10
几分钟。
然后卡在下一个加载过程
2021-06-05 12:21:22.212818: I tensorflow/stream_executor/platform/default/dso_loader.cc:42] Successfully opened dynamic library libcudnn.so.7
甚至更长的时间。您可以检查 log.txt 以获取日志详细信息。
等待大约 30 分钟后,程序将开始 运行 并且 WORK WELL。
然而,每当程序调用self.session.run(...)
时,它会加载与cuda相关的相同的两个库(libcublas和libcudnn ),又浪费时间又烦人。
我很困惑问题出在哪里以及如何解决。有人可以帮忙吗?
===================================
更新
在@talonmies 的帮助下,通过在 GPU、CUDA、cudnn 和 tensorflow 之间正确匹配版本重置环境来解决问题。现在可以正常使用了。
一般来说,如果 TF、CUDA 和 cuDNN 版本之间存在任何不兼容,您会观察到这种行为。
对于GeForce RTX 3060
,支持从CUDA 11.x
开始。一旦升级到 TF2.4
或 TF2.5
,您的问题就会得到解决。
为了社区的利益,提供经过测试的构建配置
CUDA 支持矩阵
机器设置:
显卡:GeForce RTX 3060
驱动版本:460.73.01
CUDA 驱动程序版本:11.2
Tensorflow:tensorflow-gpu 1.14.0
CUDA 运行时版本:10.0
cudnn: 7.4.1
注:
- CUDA Runtime 和 cudnn 版本符合 Tensorflow 官方文档中的指南。
- 我也试过TensorFlow-gpu = 2.0,还是一样的问题
问题:
我正在使用 Tensorflow 执行异议检测任务。我的情况是程序会卡在
2021-06-05 12:16:54.099778: I tensorflow/stream_executor/platform/default/dso_loader.cc:42] Successfully opened dynamic library libcublas.so.10
几分钟。
然后卡在下一个加载过程
2021-06-05 12:21:22.212818: I tensorflow/stream_executor/platform/default/dso_loader.cc:42] Successfully opened dynamic library libcudnn.so.7
甚至更长的时间。您可以检查 log.txt 以获取日志详细信息。
等待大约 30 分钟后,程序将开始 运行 并且 WORK WELL。
然而,每当程序调用self.session.run(...)
时,它会加载与cuda相关的相同的两个库(libcublas和libcudnn ),又浪费时间又烦人。
我很困惑问题出在哪里以及如何解决。有人可以帮忙吗?
===================================
更新
在@talonmies 的帮助下,通过在 GPU、CUDA、cudnn 和 tensorflow 之间正确匹配版本重置环境来解决问题。现在可以正常使用了。
一般来说,如果 TF、CUDA 和 cuDNN 版本之间存在任何不兼容,您会观察到这种行为。
对于GeForce RTX 3060
,支持从CUDA 11.x
开始。一旦升级到 TF2.4
或 TF2.5
,您的问题就会得到解决。
为了社区的利益,提供经过测试的构建配置
CUDA 支持矩阵