GPU 训练时 Tensorflow 2.5 退出代码 -1073740791

Tensorflow 2.5 exit code -1073740791 when GPU training

在 GPU 上训练 Tensorflow 模型时,调用:

model.fit(...)

退出代码 -1073740791 (0xC0000409) 立即:

Epoch 1/500
2021-10-16 20:13:42.154951: I tensorflow/stream_executor/platform/default/dso_loader.cc:53] Successfully opened dynamic library cudnn64_8.dll

Process finished with exit code -1073740791 (0xC0000409)

在 CPU 上做同样的事情没有任何问题。

系统信息:

运行 来自终端的相同脚本显示不同的错误,表明文件

cudnn_adv_infer64_8.dll

在路径中找不到。

从 cuDNN bin 文件夹中移动其余文件,即:

cudnn_adv_infer64_8.dll
cudnn_adv_train64_8.dll
cudnn_cnn_infer64_8.dll
cudnn_cnn_train64_8.dll
cudnn_ops_infer64_8.dll
cudnn_ops_train64_8.dll

进入 CUDA bin 文件夹解决了问题。