如何在 Docker 中使用 GPU 重新训练对象检测模型?

How to use GPU in Docker to retrain an object detection model?

我一直在关注 google coral 的 this 关于在 docker 中重新训练对象检测模型的教程,它明确指出这是针对 CPU 训练的只有,这很慢。

是否有一种简单的方法来移植此 docker 容器以利用 GPU (nvidia GTX 1080)。我已经安装了 nvidia-docker2,并成功地将我的 gpu 传递到其他容器中,据我所知,还有这个,使用 --gpus all 标签。 nvidia-smi 命令在我的容器中运行,所以我几乎可以肯定我的 GPU 已经成功通过,但是在训练模型时没有使用它。

根据nvidia-smi,CUDA版本是11.4,容器内外,我用的是Ubuntu 20.04.

您可以尝试此处提供的解决方案 Docker https://github.com/google-coral/tutorials/issues/5#issuecomment-821860067 or use the GPU based colab tutorial from google-coral tutorials (https://github.com/google-coral/tutorials) 来重新训练对象检测模型

我自己回答以关闭问题,因为我认为无法在评论中做到这一点,解决方案是来自 sebastian-sz 的评论:

"tensorflow/tensorflow:1.15.5 是 cpu 唯一的图像,你应该使用 tensorflow/tensorflow:1.15.5-gpu 来使用 CUDA。 – sebastian-sz 1 月 21 日 14:36

感谢您的帮助。