Nvidia-smi 在具有深度学习 AMI 的 AWS 的 g4ad 服务器上失败

Nvidia-smi fails on AWS's g4ad server with deep learning AMI

我正在尝试将 AWS 的 g4ad 实例与深度学习 AMI(深度学习 AMI (Ubuntu 16.04) 版本 50.0)一起使用,当我尝试执行时:

nvidia-smi

我得到:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

尽管如此,CUDA 似乎运行良好。执行 nvcc --version 时,我得到:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Mon_Oct_12_20:09:46_PDT_2020
Cuda compilation tools, release 11.1, V11.1.105
Build cuda_11.1.TC455_06.29190527_0

显然,g4ad 实例没有 Nvidia GPU, but an AMD GPU。使用 g4dn 可以完美运行。