将 TensorFlow 与 GPU 一起使用需要很长时间才能加载与 CUDA 相关的库

Using TensorFlow with GPU taking a long time for loading library related to CUDA

机器设置:

注:

  1. CUDA Runtime 和 cudnn 版本符合 Tensorflow 官方文档中的指南。
  2. 我也试过TensorFlow-gpu = 2.0,还是一样的问题

问题:

我正在使用 Tensorflow 执行异议检测任务。我的情况是程序会卡在

2021-06-05 12:16:54.099778: I tensorflow/stream_executor/platform/default/dso_loader.cc:42] Successfully opened dynamic library libcublas.so.10

几分钟。

然后卡在下一个加载过程

2021-06-05 12:21:22.212818: I tensorflow/stream_executor/platform/default/dso_loader.cc:42] Successfully opened dynamic library libcudnn.so.7

甚至更长的时间。您可以检查 log.txt 以获取日志详细信息。

等待大约 30 分钟后,程序将开始 运行 并且 WORK WELL

然而,每当程序调用self.session.run(...)时,它会加载与cuda相关的相同的两个库(libcublaslibcudnn ),又浪费时间又烦人。

我很困惑问题出在哪里以及如何解决。有人可以帮忙吗?

Discussion Issue on Github

===================================

更新

在@talonmies 的帮助下,通过在 GPU、CUDA、cudnn 和 tensorflow 之间正确匹配版本重置环境来解决问题。现在可以正常使用了。

一般来说,如果 TF、CUDA 和 cuDNN 版本之间存在任何不兼容,您会观察到这种行为。

对于GeForce RTX 3060,支持从CUDA 11.x开始。一旦升级到 TF2.4TF2.5,您的问题就会得到解决。

为了社区的利益,提供经过测试的构建配置

CUDA 支持矩阵