"Compile with USE_CUDA=1 to enable GPU usage" 在 AWS 深度学习 AMI 上使用 MXNet 的消息

Question

我想在使用 MXNet 的 g2.8xarge EC2 实例上利用所有 4 个 GPU 的同时训练一个神经网络。我正在使用以下 AWS 深度学习 Linux 社区 AMI：

亚马逊深度学习 AMI Linux - 3.3_Oct2017 - ami-999844e0)

根据这些 instructions，当我连接到实例时，我通过发出以下命令切换到带有 MXNet 后端的 keras v1：

source ~/src/anaconda3/bin/activate keras1.2_p2

我还在我的 python 模型编译代码中添加了上下文标志，以利用 MXNet 中的 GPU：

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'], context=gpu_list)

其中 gpu_list 是为了利用所有 4 个 GPU。

然而每次我运行我的代码，我都会收到这个错误信息：

Epoch 1/300 [15:09:52] /home/travis/build/dmlc/mxnet-distro/mxnet-build/dmlc-core/include/dmlc/logging.h:308: [15:09:52] src/storage/storage.cc:113: Compile with USE_CUDA=1 to enable GPU usage

和

RuntimeError: simple_bind error. Arguments: dense_input_1: (25, 34L) [15:09:52] src/storage/storage.cc:113: Compile with USE_CUDA=1 to enable GPU usage

我检查了 /home/ec2-user/src/mxnet 中的 config.mk 文件，它包含 USE_CUDA=1。我还发出了 'made' 命令来尝试使用 USE_CUDA=1 标志重新编译 MXNet - 没有变化。

我在使用 AWS 文档说明要使用的虚拟环境时是否遇到了这个问题？有没有其他人在使用这个虚拟环境的 AWS 深度学习 Ubuntu AMI 上遇到过 MXNet 的这个问题？

非常感谢任何建议-

Answer 1

这是因为Keras Conda环境依赖mxnet cpu pip包。您可以在 Conda 环境中安装 gpu 版本：

pip install mxnet-cu80

"Compile with USE_CUDA=1 to enable GPU usage" 在 AWS 深度学习 AMI 上使用 MXNet 的消息

"Compile with USE_CUDA=1 to enable GPU usage" Message with MXNet on AWS Deep Learning AMI

machine-learning

amazon-ec2

amazon-web-services

deep-learning

mxnet