Azure 数据科学 VM 上的 CNTK
CNTK on Azure Data Science VM
我有一个带有 Tesla K80 GPU 的 N 系列 Azure VM(数据科学 VM)。根据 NVIDIA 扫描仪,我的 GPU 驱动程序是最新的。
当我 运行 我的 CNTK Brainscript 时,它在 CPU 模式下显示 "No GPUs Found" 和 运行s。我能做些什么来解决问题?
requestnodes [MPIWrapper]: using 1 out of 1 MPI nodes on a single host (1 reques
ted); we (0) are in (participating)
-------------------------------------------------------------------
Build info:
Built time: Dec 22 2016 01:43:24
Last modified date: Thu Dec 22 01:35:04 2016
Build type: Release
Build target: GPU
With 1bit-SGD: yes
With ASGD: yes
Math lib: mkl
CUDA_PATH: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8
.0
CUB_PATH: c:\src\cub-1.4.1
CUDNN_PATH: C:\local\cudnn-8.0-windows10-x64-v5.1
Build Branch: HEAD
Build SHA1: 8e8b5ff92eff4647be5d41a5a515956907567126
Built by svcphil on DPHAIM-24
Build Path: C:\jenkins\workspace\CNTK-Build-Windows\Source\CNTK\
-------------------------------------------------------------------
No GPUs found
编辑:这是 NVidia_smi.exe 的输出:
C:\Program Files\NVIDIA Corporation\NVSMI>.\nvidia-smi.exe
Fri Jan 13 19:00:43 2017
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 369.30 Driver Version: 369.30 |
|-------------------------------+----------------------+----------------------+
| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Tesla K80 TCC | 0BD1:00:00.0 Off | Off |
| N/A 43C P8 27W / 149W | 0MiB / 12189MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 Tesla K80 TCC | 5871:00:00.0 Off | Off |
| N/A 35C P8 34W / 149W | 0MiB / 12189MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
您是否可以 运行 python 笔记本,看看是否可以 运行 将设备设置为 gpu(id)?或者从激活的 CNTK python 环境你可以尝试设置一些设备。
import cntk as C
from cntk.device import set_default_device, gpu
C.device.set_default_device(C.device.gpu(0))
这可能会给你一些线索,看看它是否是 Brainscript 的特定问题。
那么 python 脚本和 Brainscript 现在可以工作了,在安装 CUDA 之后(我将它安装到 运行 NVIDIA_SMI)。我不应该假设 Azure Data Science 映像(仅适用于 N 系列 VM)具有必要的 NVIDIA 库 pre-installed。 :-)
默认情况下,Windows Data Science VM 不附带 GPU 驱动程序、CUDA 等。我们有一个名为 "Deep Learning toolkit for DSVM" 的扩展,它添加了深度学习软件的驱动程序、CUDA 和 GPU 版本像 CNTK、Tensorflow、MxNet。
更多信息:http://aka.ms/dsvm/deeplearning
我们最近还发布了 Ubuntu version of DSVM 内置 CUDA、GPU 驱动程序和更多深度学习工具,可以部署在 GPU VM 或 CPU Azure 上的虚拟机上。
我有一个带有 Tesla K80 GPU 的 N 系列 Azure VM(数据科学 VM)。根据 NVIDIA 扫描仪,我的 GPU 驱动程序是最新的。 当我 运行 我的 CNTK Brainscript 时,它在 CPU 模式下显示 "No GPUs Found" 和 运行s。我能做些什么来解决问题?
requestnodes [MPIWrapper]: using 1 out of 1 MPI nodes on a single host (1 reques
ted); we (0) are in (participating)
-------------------------------------------------------------------
Build info:
Built time: Dec 22 2016 01:43:24
Last modified date: Thu Dec 22 01:35:04 2016
Build type: Release
Build target: GPU
With 1bit-SGD: yes
With ASGD: yes
Math lib: mkl
CUDA_PATH: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8
.0
CUB_PATH: c:\src\cub-1.4.1
CUDNN_PATH: C:\local\cudnn-8.0-windows10-x64-v5.1
Build Branch: HEAD
Build SHA1: 8e8b5ff92eff4647be5d41a5a515956907567126
Built by svcphil on DPHAIM-24
Build Path: C:\jenkins\workspace\CNTK-Build-Windows\Source\CNTK\
-------------------------------------------------------------------
No GPUs found
编辑:这是 NVidia_smi.exe 的输出:
C:\Program Files\NVIDIA Corporation\NVSMI>.\nvidia-smi.exe
Fri Jan 13 19:00:43 2017
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 369.30 Driver Version: 369.30 |
|-------------------------------+----------------------+----------------------+
| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Tesla K80 TCC | 0BD1:00:00.0 Off | Off |
| N/A 43C P8 27W / 149W | 0MiB / 12189MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 Tesla K80 TCC | 5871:00:00.0 Off | Off |
| N/A 35C P8 34W / 149W | 0MiB / 12189MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
您是否可以 运行 python 笔记本,看看是否可以 运行 将设备设置为 gpu(id)?或者从激活的 CNTK python 环境你可以尝试设置一些设备。
import cntk as C
from cntk.device import set_default_device, gpu
C.device.set_default_device(C.device.gpu(0))
这可能会给你一些线索,看看它是否是 Brainscript 的特定问题。
那么 python 脚本和 Brainscript 现在可以工作了,在安装 CUDA 之后(我将它安装到 运行 NVIDIA_SMI)。我不应该假设 Azure Data Science 映像(仅适用于 N 系列 VM)具有必要的 NVIDIA 库 pre-installed。 :-)
默认情况下,Windows Data Science VM 不附带 GPU 驱动程序、CUDA 等。我们有一个名为 "Deep Learning toolkit for DSVM" 的扩展,它添加了深度学习软件的驱动程序、CUDA 和 GPU 版本像 CNTK、Tensorflow、MxNet。
更多信息:http://aka.ms/dsvm/deeplearning
我们最近还发布了 Ubuntu version of DSVM 内置 CUDA、GPU 驱动程序和更多深度学习工具,可以部署在 GPU VM 或 CPU Azure 上的虚拟机上。