Google 云平台培训问题
Google Cloud Platform Training Issue
系统信息
- OS 平台和发行版:Windows 10 64 位
- TensorFlow 安装自(源或二进制):二进制
- TensorFlow 版本:1.4.0
- Python 版本 3.5.2(v3.5.2:4def2a2901a5,2016 年 6 月 25 日,22:18:55)
- GPU:nVidia GeForce 755M 2GB CPU:Intel x64-64 Intel Core i5-4200M
CPU @2.50Ghz, 8GB内存
描述问题
我可以在本地训练模型。准确性不错,但我想尝试使用 GCP 来获得类似的结果。我遵循了此处提到的 google 文档:
https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/running_on_cloud.md
https://medium.com/google-cloud/object-detection-tensorflow-and-google-cloud-platform-72e0a3f3bdd6
当我尝试 运行 使用以下命令在云端进行培训时:
gcloud ml-engine jobs submit training object_detection_188001 \ --job-dir=gs://weeddetection/train \ --packages dist/object_detection-0.1.tar.gz,slim/dist/slim-0.1.tar.gz \ --module-name object_detection.train \ --region us-central1 \ --config object_detection/samples/cloud/cloud.yml \ --train_dir=gs://weeddetection/train \ --pipeline_config_path=gs://weeddetection/data/ssd_mobilenet_v1_pets.config
我收到以下错误:
ERROR: (gcloud.ml-engine.jobs.submit.training) unrecognized arguments:
\
\
\
\
\
\
--train_dir=gs://weeddetection/train
\
--pipeline_config_path=gs://weeddetection/data/ssd_mobilenet_v1_pets.config
weeddetection is my GC bucket name and 188001 is my shell ID.
当您包含 --train-dir
和 --pipeline_config_path
等自定义选项时,您需要将它们放在命令的末尾。您还需要使用 --
分隔命令的选项和您的选项。试试这个:
gcloud ml-engine jobs submit training object_detection_188001 --job-dir=gs://weeddetection/train --packages dist/object_detection-0.1.tar.gz,slim/dist/slim-0.1.tar.gz --module-name object_detection.train --region us-central1 --config object_detection/samples/cloud/cloud.yml -- --train_dir=gs://weeddetection/train --pipeline_config_path=gs://weeddetection/data/ssd_mobilenet_v1_pets.config
系统信息
- OS 平台和发行版:Windows 10 64 位
- TensorFlow 安装自(源或二进制):二进制
- TensorFlow 版本:1.4.0
- Python 版本 3.5.2(v3.5.2:4def2a2901a5,2016 年 6 月 25 日,22:18:55)
- GPU:nVidia GeForce 755M 2GB CPU:Intel x64-64 Intel Core i5-4200M CPU @2.50Ghz, 8GB内存
描述问题 我可以在本地训练模型。准确性不错,但我想尝试使用 GCP 来获得类似的结果。我遵循了此处提到的 google 文档:
https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/running_on_cloud.md
https://medium.com/google-cloud/object-detection-tensorflow-and-google-cloud-platform-72e0a3f3bdd6
当我尝试 运行 使用以下命令在云端进行培训时:
gcloud ml-engine jobs submit training object_detection_188001 \ --job-dir=gs://weeddetection/train \ --packages dist/object_detection-0.1.tar.gz,slim/dist/slim-0.1.tar.gz \ --module-name object_detection.train \ --region us-central1 \ --config object_detection/samples/cloud/cloud.yml \ --train_dir=gs://weeddetection/train \ --pipeline_config_path=gs://weeddetection/data/ssd_mobilenet_v1_pets.config
我收到以下错误:
ERROR: (gcloud.ml-engine.jobs.submit.training) unrecognized arguments:
\
\
\
\
\
\
--train_dir=gs://weeddetection/train
\
--pipeline_config_path=gs://weeddetection/data/ssd_mobilenet_v1_pets.config
weeddetection is my GC bucket name and 188001 is my shell ID.
当您包含 --train-dir
和 --pipeline_config_path
等自定义选项时,您需要将它们放在命令的末尾。您还需要使用 --
分隔命令的选项和您的选项。试试这个:
gcloud ml-engine jobs submit training object_detection_188001 --job-dir=gs://weeddetection/train --packages dist/object_detection-0.1.tar.gz,slim/dist/slim-0.1.tar.gz --module-name object_detection.train --region us-central1 --config object_detection/samples/cloud/cloud.yml -- --train_dir=gs://weeddetection/train --pipeline_config_path=gs://weeddetection/data/ssd_mobilenet_v1_pets.config