cuDNN 产生错误无法初始化
cuDNN producing error failed to initialize
我正在尝试在自定义数据集上训练 VGGNET
模型,我已经在 colab
上试验过该模型,但现在我需要在本地机器上 运行 相同的代码。
我尝试 运行 使用 Tensorflow GPU 1.15
和 CUDA 10.0
的代码(我使用的 colab 有 Tensorflow GPU 1.15
和 CUDA 10.0
),但代码是给出这个错误
...
(0) Unknown: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
[[{{node block1_conv1/convolution}}]]
[[loss/mul/_169]]
...
我尝试过的东西
- 尝试了不同版本的 cuDNN 7.6.4 和 7.4.2
- 尝试将 Tensorflow GPU 从 1.15 降级到 1.14
我也看过这些帖子post1, 但是我无法解决错误
系统:Ubuntu 18.04
、CUDA 10.0
、cuDNN 7.4.2
、Nvidia driver 440.64
、Tensorflow GPU 1.15
RTX 卡似乎有一些问题,我必须添加几行代码才能使其正常工作
config = tf.ConfigProto()
config.gpu_options.allow_growth = True
tf.Session(config=config)
我正在尝试在自定义数据集上训练 VGGNET
模型,我已经在 colab
上试验过该模型,但现在我需要在本地机器上 运行 相同的代码。
我尝试 运行 使用 Tensorflow GPU 1.15
和 CUDA 10.0
的代码(我使用的 colab 有 Tensorflow GPU 1.15
和 CUDA 10.0
),但代码是给出这个错误
...
(0) Unknown: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
[[{{node block1_conv1/convolution}}]]
[[loss/mul/_169]]
...
我尝试过的东西
- 尝试了不同版本的 cuDNN 7.6.4 和 7.4.2
- 尝试将 Tensorflow GPU 从 1.15 降级到 1.14
我也看过这些帖子post1,
系统:Ubuntu 18.04
、CUDA 10.0
、cuDNN 7.4.2
、Nvidia driver 440.64
、Tensorflow GPU 1.15
RTX 卡似乎有一些问题,我必须添加几行代码才能使其正常工作
config = tf.ConfigProto()
config.gpu_options.allow_growth = True
tf.Session(config=config)