GCE(Google 计算引擎)GPU 配额 >= 1 但启动 VM 失败

GCE (Google Compute Engine) GPU Quota >= 1 but starting VM fails

我在我的 GCE 项目中使用 GPU 并决定请求将配额增加到 2。 我的 VM instance-1 在 us-east1-c 中,所以我导航到 IAM & Admin > Quotas 并选择了以下内容: 服务 - 仅选择了 Compute Engine API 指标 - 选定的 NVIDIA P100 GPU 和选定的 NVIDIA p100 虚拟工作站 GPU 位置 - 仅选择 us-east1 在收到通知我增加到 2 个 GPU 的配额已获批准后,我去启动我的 VM 实例并得到错误代码:

我仔细检查了我的配额页面并确认增加到 2 个 GPU。 Support@google 告诉我请求增加 GPUs Globaly,所以我提交了一个新请求,选择所有,包括 Global 选项:

现在,当我尝试启动 VM instance-1 时,我得到:

所以错误消息说我的配额是 0.0,但是,在 IAM 和管理页面下查看我的配额,我在每个位置都有 2 的配额,包括 us-east1(europe-west3 除外,对于一些原因):

为了排除故障,我尝试在同一项目的不同位置以及在新项目中使用 GPU 启动新的 VM 实例,但每次都收到类似的错误消息。我已经验证了我选择的位置有使用此 link 的 GPU 更让人困惑的是,在我作为测试场开始的新项目中,没有人玩过任何设置;配额都默认为 1,但我仍然收到错误消息。 我做错了什么?

除了请求增加区域配额外,您还需要请求增加全球配额。

与虚拟CPU配额类似,GPU配额是指一个区域中所有VM实例中虚拟GPU的总数。检查配额页面以确保您的项目中有足够的 GPU 可用,并请求增加配额。 此外,新帐户和项目具有适用于所有区域的全球 GPU 配额。

当您请求 GPU 配额时,您必须为您要在每个区域创建的 GPU 模型申请一个配额,并为所有类型的 GPU 总数申请一个额外的全局配额所有区域。

记录了这个过程HERE

您可以使用过滤器 Location = Global 来查找它

现在对于第二个错误,即该区域没有足够的资源,如果您看到 'ZONE_RESOURCE_POOL_EXHAUSTED' 错误意味着您在该特定区域遇到临时资源缺货问题,您应该尝试部署在不同的区域

我建议你从这个帖子中删除你的第二张图片,因为你的项目 ID 是可见的

您的 GPU(所有区域) 计数必须等于您请求增加配额的每个区域中的 GPU 总和。使用 ctrl & f 的搜索对我不起作用——导航到 IAM & admin > 单击 Metric 下拉列表 > 在提供的搜索栏中,键入“GPUs (所有地区) "