JSON 控制台中 GCP 监控警报策略的模拟
JSON analog of GCP Monitoring alert policy in console
我希望 GCP 在计划使用调度程序定期触发的我的 Cloud Functions 之一出现错误时发送警报。我进入控制台并创建了一个如下所示的策略
policy in console - 简而言之,我正在监视云函数错误执行计数。如果 1 小时内错误计数高于 0,我应该收到警报。
现在我的问题有两个。
- 根据以上条件,我有
any time series violates above 0 for 1 hour
。如果我不关闭这些错误(可能 30 天),即使该函数当前正在成功执行,我仍然会收到正确的警报?有没有办法只在 MOST RECENT time series violates above 0 for 1 hour
时发出警报?如果是这样,我怎么能把它写成 JSON 格式?
- 上面显示的 GCP 监控警报策略的 JSON 模拟是什么?
我已经拼凑了我可以在文档中找到的信息。这是我目前所拥有的。
{
"conditions": [
{
"conditionThreshold": {
"comparison": "COMPARISON_GT",
"duration": "3600s",
"filter": "metric.type=\"cloudfunctions.googleapis.com/function/execution_count" AND
resource.type=\"cloud_function\" AND
function_name=\"function-1\" AND
status=\"error\"",
"thresholdValue": 0,
"trigger": {
"count": 1
}
}
}
],
}
我是 StackExchange 的新手,所以如果我的问题格式不正确,请告诉我。非常感谢您的宝贵时间和帮助!
警报策略导致的事件将自动 resolve once the condition that triggered the incident is no longer true. You don't need to do anything to "close" the error unless you're just looking to suppress further notifications, which is what "acknowledge”适用于。没有可用的 "most recent" 时间序列条件;您可能需要为每个函数创建单独的警报策略 - 并且看来你已经在这么做了。
您认为 JSON 不正确的原因是什么?我建议根据您遇到的问题提出问题,而不是让其他人在您自己验证之前验证您的 code/work。
我希望 GCP 在计划使用调度程序定期触发的我的 Cloud Functions 之一出现错误时发送警报。我进入控制台并创建了一个如下所示的策略
policy in console - 简而言之,我正在监视云函数错误执行计数。如果 1 小时内错误计数高于 0,我应该收到警报。
现在我的问题有两个。
- 根据以上条件,我有
any time series violates above 0 for 1 hour
。如果我不关闭这些错误(可能 30 天),即使该函数当前正在成功执行,我仍然会收到正确的警报?有没有办法只在MOST RECENT time series violates above 0 for 1 hour
时发出警报?如果是这样,我怎么能把它写成 JSON 格式? - 上面显示的 GCP 监控警报策略的 JSON 模拟是什么?
我已经拼凑了我可以在文档中找到的信息。这是我目前所拥有的。
{
"conditions": [
{
"conditionThreshold": {
"comparison": "COMPARISON_GT",
"duration": "3600s",
"filter": "metric.type=\"cloudfunctions.googleapis.com/function/execution_count" AND
resource.type=\"cloud_function\" AND
function_name=\"function-1\" AND
status=\"error\"",
"thresholdValue": 0,
"trigger": {
"count": 1
}
}
}
],
}
我是 StackExchange 的新手,所以如果我的问题格式不正确,请告诉我。非常感谢您的宝贵时间和帮助!
警报策略导致的事件将自动 resolve once the condition that triggered the incident is no longer true. You don't need to do anything to "close" the error unless you're just looking to suppress further notifications, which is what "acknowledge”适用于。没有可用的 "most recent" 时间序列条件;您可能需要为每个函数创建单独的警报策略 - 并且看来你已经在这么做了。
您认为 JSON 不正确的原因是什么?我建议根据您遇到的问题提出问题,而不是让其他人在您自己验证之前验证您的 code/work。