在 gcloud ml 引擎上进行 tensorflow 训练时出错
Error while tensorflow training on gcloud ml engine
我正在按照此 ml-engine guide. I did setup my gcloud
and created vm
also. For tensorflow
, I am using Anaconda 3 创建我的 python 环境。我用 python=3.6
创建了新环境。但是当我开火时
gcloud ml-engine local train --module-name trainer.task --package-path trainer -- --train-files c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\data\adult.data.csv --eval-files c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\data\adult.test.csv --train-steps 1000 --job-dir c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\output --eval-steps 100
我遇到以下错误
Traceback (most recent call last):
File "D:\gcsdk174\google-cloud-sdk\platform\bundledpython\lib\runpy.py", line 174, in _run_module_as_main
"__main__", fname, loader, pkg_name)
File "D:\gcsdk174\google-cloud-sdk\platform\bundledpython\lib\runpy.py", line 72, in _run_code
exec code in run_globals
File "C:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\trainer\task.py", line 4, in <module>
import model
File "trainer\model.py", line 20, in <module>
import tensorflow as tf
ImportError: No module named tensorflow
我可以按照指南使用 pip install -r ../requirements.txt
命令成功安装 tensorflow。
谁能指出我做错了什么?
更新:这个问题现在应该已经用最新版本的 gcloud 解决了。你能试试看它是否适合你吗?首先做:
gcloud components update
发生的事情是 gcloud(默默地)需要 py2.7,这会导致您的导入错误。这是一个我们将很快修复的错误。 (这对于 Windows 来说尤其成问题,因为 TF 不支持 windows 的 2.7 安装)。 修复后我们会在这里更新。
与此同时,最好的选择可能是直接通过 运行 您的 python 脚本在本地进行测试(除非您尝试在本地测试分布式训练)。
如果您尝试在本地测试分布式训练,那么您最好的临时选择可能是使用 Docker 和 TensorFlow docker container.
我正在按照此 ml-engine guide. I did setup my gcloud
and created vm
also. For tensorflow
, I am using Anaconda 3 创建我的 python 环境。我用 python=3.6
创建了新环境。但是当我开火时
gcloud ml-engine local train --module-name trainer.task --package-path trainer -- --train-files c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\data\adult.data.csv --eval-files c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\data\adult.test.csv --train-steps 1000 --job-dir c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\output --eval-steps 100
我遇到以下错误
Traceback (most recent call last):
File "D:\gcsdk174\google-cloud-sdk\platform\bundledpython\lib\runpy.py", line 174, in _run_module_as_main
"__main__", fname, loader, pkg_name)
File "D:\gcsdk174\google-cloud-sdk\platform\bundledpython\lib\runpy.py", line 72, in _run_code
exec code in run_globals
File "C:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\trainer\task.py", line 4, in <module>
import model
File "trainer\model.py", line 20, in <module>
import tensorflow as tf
ImportError: No module named tensorflow
我可以按照指南使用 pip install -r ../requirements.txt
命令成功安装 tensorflow。
谁能指出我做错了什么?
更新:这个问题现在应该已经用最新版本的 gcloud 解决了。你能试试看它是否适合你吗?首先做:
gcloud components update
发生的事情是 gcloud(默默地)需要 py2.7,这会导致您的导入错误。这是一个我们将很快修复的错误。 (这对于 Windows 来说尤其成问题,因为 TF 不支持 windows 的 2.7 安装)。 修复后我们会在这里更新。
与此同时,最好的选择可能是直接通过 运行 您的 python 脚本在本地进行测试(除非您尝试在本地测试分布式训练)。
如果您尝试在本地测试分布式训练,那么您最好的临时选择可能是使用 Docker 和 TensorFlow docker container.