在 WML 上训练模型时出现分段错误
Segmentation fault error when training a model on WML
我正在尝试在 Watson 机器学习平台上训练模型,当我 运行 命令行时出现此错误:
bx ml train model.zip training-runs.yml
错误:
....
[--LOGS] training-bEgMj0wiR: You are using pip version 9.0.3, however version 18.1 is available.
[--LOGS] training-bEgMj0wiR: You should consider upgrading via the 'pip install --upgrade pip' command.
[--LOGS] training-bEgMj0wiR: /usr/local/bin/train.sh: line 38: 48 Segmentation fault python3 train.py 2>&1
[--LOGS] training-bEgMj0wiR: Training exited with error code 139
[--LOGS] training-bEgMj0wiR: Failed: learner_exit_code: 139
您可以注意到它提到的命令行是:
python3 train.py
看起来像是与模型 运行ning 所在的机器相关的错误。当我 运行 通过设置本地环境变量在本地机器上进行训练时,一切正常。
我注意到 WML 服务托管在美国 us-south
并且数据存储在 London
的 Cloud Object Storage 中,所以我将 WML 服务更改为伦敦,错误消失了.
我不确定它们之间的关系是什么...但以防万一有人遇到同样的问题。
我正在尝试在 Watson 机器学习平台上训练模型,当我 运行 命令行时出现此错误:
bx ml train model.zip training-runs.yml
错误:
....
[--LOGS] training-bEgMj0wiR: You are using pip version 9.0.3, however version 18.1 is available.
[--LOGS] training-bEgMj0wiR: You should consider upgrading via the 'pip install --upgrade pip' command.
[--LOGS] training-bEgMj0wiR: /usr/local/bin/train.sh: line 38: 48 Segmentation fault python3 train.py 2>&1
[--LOGS] training-bEgMj0wiR: Training exited with error code 139
[--LOGS] training-bEgMj0wiR: Failed: learner_exit_code: 139
您可以注意到它提到的命令行是:
python3 train.py
看起来像是与模型 运行ning 所在的机器相关的错误。当我 运行 通过设置本地环境变量在本地机器上进行训练时,一切正常。
我注意到 WML 服务托管在美国 us-south
并且数据存储在 London
的 Cloud Object Storage 中,所以我将 WML 服务更改为伦敦,错误消失了.
我不确定它们之间的关系是什么...但以防万一有人遇到同样的问题。