GCP 虚拟机停止响应

GCP VM stopped responding

我们在 GCP 上有一个 VM 服务器。昨天,服务器停止响应,我们甚至无法 SSH 进入服务器,但重启服务器后一切正常。我正在查看指标,这是我注意到的:

  1. 那个时期没有内存利用率数据。在此之前,内存利用率为90%。
  2. Read Through Put 相当高; 13 MiB/s

可能出了什么问题?我还应该考虑看什么?

哈里斯:

您 VM 中的应用程序进程 运行 消耗了分配给 VM 的全部内存。 分析托管在 VM 上的每个应用程序并评估其 MTR(最低技术要求)和每个应用程序代表的实际工作负载,这是为了估计分配的​​内存量是否足以支持该负载。 如果在这些应用程序上可用,请查阅日志条目,看看它们是否可以在无响应情况下显示消耗水平。 如果您必须增加分配给虚拟机的任何资源容量,请考虑 changing the machine type

如果您的应用程序 运行 在您的 VM 上的资源消耗变化很大,您将需要考虑实施 autoscaling groups of instances