Cloud ML Tensorflow 和 Cudnn 版本兼容性

Cloud ML Tensorflow and Cudnn versions compatibility

我想在 Cloud ML 上使用 Tensorflow 1.3(可能还有 1.4)。在 Cloud ML

上的多 GPU 机器上执行 运行ning 作业

我通过在 setup.py 中指定 tensorflow 版本来做到这一点,如下所示:

from setuptools import setup

REQUIRED_PACKAGES = ['tensorflow==1.3.0']

setup(
    name='my-image-classification',
    install_requires=REQUIRED_PACKAGES,
    version='1.0',
    packages=['my_image_classification',
              'my_image_classification/foo',
              'my_image_classification/bar',
              'my_image_classification/utils'],
    )

Cloud ML 上安装的 cudnn 库是什么?它与 tensorflow 1.3 和 tensorflow 1.3+ 兼容吗?

我可以启动作业,但性能比预期值低 10 倍,我很好奇库的底层链接是否存在问题

编辑:

我现在非常有信心 Cloud ML 上的 Cudnn 版本不符合 Tensorflow 1.3 的要求。我注意到 Tensorflow 1.3 作业缺少 "Creating Tensorflow device (/gpu:0...) " 日志,当我 运行 一个具有默认可用 Tensorflow on cloud ml

的作业时出现

免责声明:自 2017 年 11 月 1 日起,官方不支持使用 1.0、1.2 以外的任何版本。

您需要指定支持 GPU 的 TensorFlow 版本:

REQUIRED_PACKAGES = ['tensorflow-gpu==1.3.0']

但是 pip 的版本已经过时,所以您需要先强制更新它。