AWS fargate 任务无法可靠地启动

AWS fargate tasks won't start reliably

我有一个 ECS 集群,里面有很多不同的任务(使用相同的 docker 图像但具有不同的环境变量)。

即使我使用了相同的 VPC、子网和安全组,一些任务也没有问题,但其他任务失败了很多。错误信息显示 ResourceInitializationError: unable to pull secrets or registry auth: execution resource retrieval failed: unable to retrieve ecr registry auth: service call has been retried 3 time(s): RequestError: send request failed caused by: Post https://api.ecr..

奇怪的是,如果我创建新的任务定义或删除 ECR 存储库并重新上传 docker 图像,有时会出现相同的任务。

我无法从中得出任何结论..

更新:奇怪...当我取消注册任务定义并使用相同的规范重新创建它时,任务成功启动。但只有一次..

事实证明,在启动任务时,必须 select Task Role - overriderun task Advanced Options 部分中的 Task Execution Role - override 的 taskExecution 角色。我不知道为什么每次重新创建任务定义时随机尝试或工作时它是任意工作。