在 WML 上训练模型时出现分段错误

Segmentation fault error when training a model on WML

我正在尝试在 Watson 机器学习平台上训练模型,当我 运行 命令行时出现此错误:

bx ml train model.zip training-runs.yml 

错误:

....
[--LOGS]      training-bEgMj0wiR: You are using pip version 9.0.3, however version 18.1 is available.

[--LOGS]      training-bEgMj0wiR: You should consider upgrading via the 'pip install --upgrade pip' command.

[--LOGS]      training-bEgMj0wiR: /usr/local/bin/train.sh: line 38:    48 Segmentation fault      python3 train.py 2>&1

[--LOGS]      training-bEgMj0wiR: Training exited with error code 139

[--LOGS]      training-bEgMj0wiR: Failed: learner_exit_code: 139

您可以注意到它提到的命令行是:

python3 train.py 

看起来像是与模型 运行ning 所在的机器相关的错误。当我 运行 通过设置本地环境变量在本地机器上进行训练时,一切正常。

我注意到 WML 服务托管在美国 us-south 并且数据存储在 London 的 Cloud Object Storage 中,所以我将 WML 服务更改为伦敦,错误消失了.

我不确定它们之间的关系是什么...但以防万一有人遇到同样的问题。