GPU内存不足错误的Theano
Theano for GPU out of memory error
几个小时前,搭建了Theano+Keras GPU环境,运行ning成功。我什至测试了一些代码以确保它在 GPU 上执行。但是,当我 运行 import theano
现在,我得到以下错误:
ERROR (theano.gpuarray): Could not initialize pygpu, support disabled
Traceback (most recent call last):
.
.
.
.
GpuArrayException: cuDevicePrimaryCtxRetain: CUDA_ERROR_OUT_OF_MEMORY: out of memory
我在我们大学的服务器上使用了一个 GPU,它被实验室中的许多学生共享。错误可能是由于其他 运行ning 进程导致内存不足? nvidia-smi
的输出如下所示。 PID 29586
的进程是我的。
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 387.12 Driver Version: 387.12 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX TIT... Off | 00000000:01:00.0 On | N/A |
| 48% 83C P2 196W / 250W | 12152MiB / 12198MiB | 99% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 10977 C python 5506MiB |
| 0 24129 C python 6323MiB |
| 0 25238 G /usr/lib/xorg/Xorg 110MiB |
| 0 25773 G /usr/bin/gnome-shell 90MiB |
| 0 29586 C python 106MiB |
+-----------------------------------------------------------------------------+
GPU 是 Nvidia Titan X。我在谷歌上广泛搜索了这个错误,并在过去的几个小时里尝试了很多方法。请帮忙。
为简单起见,是的,卡内存不足。 TITAN X 有 12 GB 内存,第一个进程几乎用完了所有内存。如果他们将其用于深度学习,也许可以询问所有者他们是否可以暂停他们的过程或使用更小的批量大小。
几个小时前,搭建了Theano+Keras GPU环境,运行ning成功。我什至测试了一些代码以确保它在 GPU 上执行。但是,当我 运行 import theano
现在,我得到以下错误:
ERROR (theano.gpuarray): Could not initialize pygpu, support disabled
Traceback (most recent call last):
.
.
.
.
GpuArrayException: cuDevicePrimaryCtxRetain: CUDA_ERROR_OUT_OF_MEMORY: out of memory
我在我们大学的服务器上使用了一个 GPU,它被实验室中的许多学生共享。错误可能是由于其他 运行ning 进程导致内存不足? nvidia-smi
的输出如下所示。 PID 29586
的进程是我的。
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 387.12 Driver Version: 387.12 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX TIT... Off | 00000000:01:00.0 On | N/A |
| 48% 83C P2 196W / 250W | 12152MiB / 12198MiB | 99% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 10977 C python 5506MiB |
| 0 24129 C python 6323MiB |
| 0 25238 G /usr/lib/xorg/Xorg 110MiB |
| 0 25773 G /usr/bin/gnome-shell 90MiB |
| 0 29586 C python 106MiB |
+-----------------------------------------------------------------------------+
GPU 是 Nvidia Titan X。我在谷歌上广泛搜索了这个错误,并在过去的几个小时里尝试了很多方法。请帮忙。
为简单起见,是的,卡内存不足。 TITAN X 有 12 GB 内存,第一个进程几乎用完了所有内存。如果他们将其用于深度学习,也许可以询问所有者他们是否可以暂停他们的过程或使用更小的批量大小。