使用 a1.small 实例调用 SageMaker deploy_endpoint 函数时,出现无法打开 m5.xlarge 实例的错误

When calling a SageMaker deploy_endpoint function with an a1.small instance, I'm given an error that I can't open a m5.xlarge instance

所以在通过 Autopilot 生成的笔记本执行时,我去执行了最终的代码单元:

pipeline_model.deploy(initial_instance_count=1,
                      instance_type='a1.small',
                      endpoint_name=pipeline_model.name,
                      wait=True)

我收到这个错误

ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling the CreateEndpoint operation: The account-level service limit 'ml.m5.2xlarge for endpoint usage' is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances. Please contact AWS support to request an increase for this limit.

其中最重要的部分是提到资源限制的最后一行。我没有尝试打开它给我错误的实例类型。

端点是否需要位于 ml.m5.2xlarge 实例上?还是代码有问题?

在此先感谢大家。

您应该使用支持的按需 ML 托管实例之一,详见 this link。我认为无效 instance_type='a1.small' 已替换为有效的 (ml.m5.2xlarge),并且不在您的 AWS 服务配额中。奇怪的是看到 instance_type='a1.small' 是由 SageMaker Autopilot 生成的。