在 gcloud ml 引擎上进行 tensorflow 训练时出错

Error while tensorflow training on gcloud ml engine

我正在按照此 ml-engine guide. I did setup my gcloud and created vm also. For tensorflow, I am using Anaconda 3 创建我的 python 环境。我用 python=3.6 创建了新环境。但是当我开火时

gcloud ml-engine local train --module-name trainer.task --package-path trainer -- --train-files c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\data\adult.data.csv --eval-files c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\data\adult.test.csv --train-steps 1000 --job-dir c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\output --eval-steps 100

我遇到以下错误

Traceback (most recent call last):
File "D:\gcsdk174\google-cloud-sdk\platform\bundledpython\lib\runpy.py", line 174, in _run_module_as_main
"__main__", fname, loader, pkg_name)
File "D:\gcsdk174\google-cloud-sdk\platform\bundledpython\lib\runpy.py", line 72, in _run_code
exec code in run_globals
File "C:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\trainer\task.py", line 4, in <module>
import model
File "trainer\model.py", line 20, in <module>
import tensorflow as tf
ImportError: No module named tensorflow

我可以按照指南使用 pip install -r ../requirements.txt 命令成功安装 tensorflow。

谁能指出我做错了什么?

更新:这个问题现在应该已经用最新版本的 gcloud 解决了。你能试试看它是否适合你吗?首先做:
gcloud components update

发生的事情是 gcloud(默默地)需要 py2.7,这会导致您的导入错误。这是一个我们将很快修复的错误。 (这对于 Windows 来说尤其成问题,因为 TF 不支持 windows 的 2.7 安装)。 修复后我们会在这里更新。

与此同时,最好的选择可能是直接通过 运行 您的 python 脚本在本地进行测试(除非您尝试在本地测试分布式训练)。

如果您尝试在本地测试分布式训练,那么您最好的临时选择可能是使用 Docker 和 TensorFlow docker container.