从 GKE 切换到 Cloud 运行 - 健康检查、活跃度、就绪性和一般监控的最佳实践

Switching from GKE to Cloud Run - best practices for healthcheck, liveness, readiness and general monitoring

我正在考虑将一些微服务从 GKE 切换到云 运行 但我无法找到与运行状况检查、活跃度、就绪性和一般监控相关的任何信息部署到 GKE 时处理。

我假设只有当容器部署到云端时,健康检查和活跃度才有可能运行,但当服务缩减为 0 时,它将不可用。那时在监控中我会得到服务中断。

所以我的问题是为云处理它们的最佳实践是什么 运行?

我会尝试一次一个地回答您的问题

  • 就绪和活跃度探测。 Cloud 运行 在您的服务前面部署一个 LoadBalancer 并为您处理 TLS 终止。云 运行 期望您的容器在其部署后的 4 minutes 内可用(也就是在定义的端口上侦听 0.0.0.0),否则,它认为它已关闭并尝试重新启动它。
  • Cloud 运行 具有 built-in 监控和警报功能,如果您使用的是 Cloud Ops,则无需执行任何操作。
  • 您可以通过将最小副本数设置为 1 确保您的服务始终至少有 1 个副本可用,从而确保您的服务不会触发误报

如果你有什么想澄清的,请告诉我