模型 returns 在 GTXA5000 上只有 NaN 值,但在 1080TI 上没有

Model returns only NaN values on GTXA5000 but not on 1080TI

我在台式机上用GTX A5000更换了GTX 1080TI显卡,重新安装Ubuntu从16.04升级到20.04以满足要求。 但是现在我无法用我们当前的模型进行再训练或预测;加载模型时,Keras 挂了很长时间,所有预测结果都是 NaN 值。 我们将 Keras 2.2.4 与 tensorflow 2.1.0 和 Cuda 10.1.243 一起使用,这是我使用 Conda 安装的,我尝试了不同的驱动程序。

如果我将旧的 GTX 1080 TI 卡放回机器中,代码工作正常。

知道哪里出了问题 - 会不会是 A5000 不支持与旧 1080TI 卡相同的型号?

好的,我可以确认此设置适用于 GTX A5000

  • CUDA:11.6.0
  • 张量流:2.7.0

驱动版本:510.47.03

感谢@talonmies 的评论。