AWS Sagemaker 部署失败

AWS Sagemaker Deploy fails

我正在按照 sage maker documentation 训练和部署 ML 模型。我正在使用 Amazon SageMaker 提供的高级 Python 库来实现此目的。

kmeans_predictor = kmeans.deploy(initial_instance_count=1,
                                 instance_type='ml.m4.xlarge')

部署失败并出现错误

ResourceLimitExceeded:调用 CreateEndpoint 操作时发生错误 (ResourceLimitExceeded):帐户级服务限制 'ml.c4.8xlarge for endpoint usage' 为 0 个实例,当前使用 0 个实例,请求增量为 1 个实例。

我哪里错了?

我通过更改实例类型解决了这个问题:

kmeans_predictor = kmeans.deploy(initial_instance_count=1,
                                 instance_type='ml.t2.medium')

回答

在 free_tier AWS 账户下,使用 'InstanceType':'ml.t2.medium' 成功部署机器学习模型。默认情况下,如果您在线学习 AWS 教程,您最终会使用 'ml.m4.xlarge',这会导致此错误。

因此,在代码 spinets 中使用 'InstanceType':'ml.t2.medium' 而不是 'ml.m4.xlarge' 实例如下图所示。

错误是由于帐户级别的服务限制。 Free_tier 账户在使用 EC2 实例类型 'ml.m4.xlarge' 时出现错误。因此,请使用 'ml.t2.medium' 而不是 ml.m4.xlarge'。 通常,在创建 AWS 端点时,free_account 持有者会遇到以下错误:

ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling the CreateEndpoint operation: The account-level service limit 'ml.m4.xlarge for endpoint usage' is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances. Please contact AWS support to request an increase for this limit.

代码更改以在 AWS 上成功部署机器学习模型: