不支持 ML 引擎运行时版本和 Python 版本

ML Engine Runtime version and Python version not supported

我正在尝试 运行 Google clound ml-engine following this tutorial,当执行此命令时:

$ gcloud ml-engine jobs submit training `whoami`_object_detection_`date +%s` \ 
    --job-dir=gs://${YOUR_GCS_BUCKET}/train\
    --packages dist/object_detection-0.1.tar.gz,slim/dist/slim-0.1.tar.gz,/tmp/pycocotools/pycocotools-2.0.tar.gz\
    --module-name object_detection.model_tpu_main \
    --runtime-version 1.10\
    --scale-tier BASIC_TPU\
    --region us-central1\
    --
    --model_dir=gs://${YOUR_GCS_BUCKET}/train
    --tpu_zone us-central1
    --pipeline_config_path=gs://${YOUR_GCS_BUCKET}/data/pipeline.config 

回答我的命令:

  ERROR: (gcloud.ml-engine.jobs.submit.training) INVALID_ARGUMENT: Field: runtime_version Error: The specified runtime version '1.10' with the Python version '' is not supported for TPU training.  Please specify a different runtime version. See https://cloud.google.com/ml/docs/concepts/runtime-version-list for a list of supported versions
- '@type': type.googleapis.com/google.rpc.BadRequest
  fieldViolations:
  - description: The specified runtime version '1.10' with the Python version '' is
  not supported for TPU training.  Please specify a different runtime version.
  See https://cloud.google.com/ml/docs/concepts/runtime-version-list for a list
  of supported versions
field: runtime_version

因为没有检测到 python 的版本,所以我在命令行中添加了一个 --config=config.yaml 参数:

config.yaml:

trainingInput:
  pythonVersion: "3.5"

但问题几乎没有改变:

...
 - description: The specified runtime version '1.10' with the Python version '3.5'
...

runtime version list 指定 运行time-version 1.10 与 python 3.5 兼容,我也尝试了不同的 运行time environement / python version这是工作所必需的,但我的命令总是失败。

@jdehesa 说的对,支持的版本是1.9。版本 1.10 is not supported for training Cloud TPU models。更改运行时版本编辑此标志:

--runtime-version 1.9

有关信息,当前支持的版本现在是 1.111.12 runtime-version-list

即使在确保所有版本都兼容后,我也遇到了同样的问题。

将此行添加到 gcloud 训练命令(在运行时版本行下方)后,它运行良好。

--python-version 3.7 \