如何在 GKE 服务上设置 Cloud 运行 的最小规模?

How to set a minimum scale for Cloud Run on GKE services?

我在 Google Kubernetes Engine 上使用 Cloud 运行,我能够毫无问题地部署和访问服务。

但是由于我 运行 在 GKE 上并且全天候 24/7 为集群付费,因此将部署扩展到零并且始终对第一个请求进行冷启动是没有意义的。

我发现可以为 Knative 自动缩放器设置 minScale 以禁用缩放为零 here, here and here,但我不知道该放在哪里。

GKE 中有很多用于 Isito 和 Knative-Serving 的配置、服务和工作负载,但我找不到任何匹配的。

我必须编辑哪个文件或配置才能将 minScale 设置为 1?或者这不可能,因为 Cloud 运行 在内部管理特定模板?

使用 kubectl,您应该能够在 Knative 服务上设置注释 autoscaling.knative.dev/minScale: "1"

有关详细信息,请参阅 this page