如何找出我的 (NVIDIA) GPU 上的 运行 是什么?

How to figure out what is running on my (NVIDIA) GPU?

我正在使用我的 GPU (Tesla K80) 使用 tensorflow 训练神经网络,但出现了问题。当我键入 nvidia-smi 时,我看到正在使用内存的 11239MiB / 11439MiB,但没有为 GPU 列出任何进程。 通常发生这种情况时,我可以键入 ps aux | grep python 并找到正在使用 GPU 的进程,但这次什么也没有发生。

如何找出我的 GPU 上的 运行 是什么,以及如何终止它?

查看使用 GPU 的用户正在 运行 的所有进程。杀死所有可能使用了 GPU 的进程。

ps -ef | grep <username>

你也可以试试

sudo nvidia-smi --gpu-reset

如果还是不行就考虑重启。