AWS Cloudwatch 警报设置为 NonBreaching(或 notBreaching)未触发,基于日志过滤器
AWS Cloudwatch alarm set to NonBreaching (or notBreaching) is not triggering, based on a log filter
具有以下指标和警报组合
- 公制
- 来自 Cloudwatch 日志过滤器(在日志中找到匹配项时)
- 指标值:“1”
- 默认值:None
- 单位:计数
- 报警
- 统计:总和
- 时长:1 分钟
- 将缺失数据视为:notBreaching
- 阈值:[指标] > 1 分钟内 1 个数据点的 0
警报转到:
状态在 2018/12/17 更改为 OK。
原因:已超过阈值:1 个周期内未收到任何数据点,1 个丢失的数据点被视为 [NonBreaching]。
然后它不会触发,即使我强制指标 > 0
为什么闹钟卡在OK?警报如何再次触发?
解决方案
从堆栈模板警报配置中删除“单元”属性。
问题的根源实际上是“Unit”属性。这被设置为“计数”实际上使警报卡住了:(
通过检查 describe-alarms
API.
确保堆栈产生与手动警报设置相同的结果
具有以下指标和警报组合
- 公制
- 来自 Cloudwatch 日志过滤器(在日志中找到匹配项时)
- 指标值:“1”
- 默认值:None
- 单位:计数
- 报警
- 统计:总和
- 时长:1 分钟
- 将缺失数据视为:notBreaching
- 阈值:[指标] > 1 分钟内 1 个数据点的 0
警报转到: 状态在 2018/12/17 更改为 OK。
原因:已超过阈值:1 个周期内未收到任何数据点,1 个丢失的数据点被视为 [NonBreaching]。
然后它不会触发,即使我强制指标 > 0
为什么闹钟卡在OK?警报如何再次触发?
解决方案
从堆栈模板警报配置中删除“单元”属性。
问题的根源实际上是“Unit”属性。这被设置为“计数”实际上使警报卡住了:(
通过检查 describe-alarms
API.