docker version 18.09 version of --gpus all

docker version 18.09 version of --gpus all

我正在尝试 运行 在安装了 docker 18.09.5 的服务器上启用 gpu 的容器。这是一个共享服务器,所以我不能只升级 docker 版本。

我有一个 docker 19.03.12 的私人服务器,以下工作正常:

docker pull vistart/cuda
docker run --name somename --gpus all -it --shm-size=10g -v /dataloc:/mountedData vistart/cuda /bin/sh

nvidia-smi

产量:预期的 gpu 统计数据

当我使用 docker 18.09 在服务器上尝试此操作时:

docker pull vistart/cuda
docker run --name somename --gpus all -it --shm-size=10g -v /dataloc:/mountedData 

产量:

unknown flag: --gpus-all
See 'docker run --help'.

docker run --name somename -it --shm-size=10g -v /dataloc:/mountedData 

有效但是.. nvidia-smi 产量:

/bin/sh: 1: nvidia-smi: not found

是否有一些 v18.09 版本的 --gpus all 可以工作?

我试过nvidia-docker:

nvidia-docker run --name somename -it --shm-size=10g -v /dataloc:/mountedData 

这会产生:

docker: Error response from daemon: OCI runtime create failed: container_linux.go:345: starting container process caused "process_linux.go:424: container init caused \"process_linux.go:407: running prestart hook 1 caused \\"error running hook: exit status 1, stdout: , stderr: exec command: [/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig --device=all --compute --utility --require=cuda>=11.0 brand=tesla,driver>=384,driver<385 brand=tesla,driver>=396,driver<397 brand=tesla,driver>=410,driver<411 brand=tesla,driver>=440,driver<441 brand=tesla,driver>=450,driver<451 --pid=3030 /local/var_local/nobackup/docker/overlay2/d096e63d0a34537f04cbafeb1b6c3315b4e6f0ff15e3e2cb30057f549dc75cb5/merged]\\nnvidia-container-cli: requirement error: unsatisfied condition: brand = tesla\\n\\"\"": unknown.

看起来共享是 运行ning CUDA 10.1 所以它没有达到 cuda>-11.0 要求...

19.03 开始​​,您可以使用:

docker run --gpus all myimage

对于以前的版本,您可以像这样使用 nvidia-docker

nvidia-docker run myimage