在 GKE 中设置 Pod 驱逐警报
Set up alerting for pod evictions in GKE
我遇到 pods 偶尔会在 运行 内存不足后被逐出的情况。有什么方法可以设置某种警报,以便在发生这种情况时通知我?
事实上,Kubernetes 一直在做它的工作,并在旧的被删除后重新创建 pods,而且通常在数小时或数天之后我才意识到问题存在。
GKE 将 Kubernetes 事件 (kubectl get events
) 导出到 Stackdriver Logging,到 "GKE Cluster Operations" table:
接下来,写一个专门针对驱逐的查询(我粘贴在下面的查询可能不准确):
然后点击"CREATE METRIC"按钮。
这将创建一个 Log-based 指标。在左侧边栏中,单击 "Logs-based metrics",然后单击此指标上下文菜单中的 "Create alert from metric" 选项:
接下来,您将转到 Stackdriver 警报门户。您可以在那里根据阈值等设置警报。
我遇到 pods 偶尔会在 运行 内存不足后被逐出的情况。有什么方法可以设置某种警报,以便在发生这种情况时通知我?
事实上,Kubernetes 一直在做它的工作,并在旧的被删除后重新创建 pods,而且通常在数小时或数天之后我才意识到问题存在。
GKE 将 Kubernetes 事件 (kubectl get events
) 导出到 Stackdriver Logging,到 "GKE Cluster Operations" table:
接下来,写一个专门针对驱逐的查询(我粘贴在下面的查询可能不准确):
然后点击"CREATE METRIC"按钮。
这将创建一个 Log-based 指标。在左侧边栏中,单击 "Logs-based metrics",然后单击此指标上下文菜单中的 "Create alert from metric" 选项:
接下来,您将转到 Stackdriver 警报门户。您可以在那里根据阈值等设置警报。