Nagios - 如何处理预期的非正常状态?

Nagios - How to Handle Expected Non-OK Statuses?

每 night/morning 大约 1:00 上午,服务器运行其每日备份。在此期间,CPU-使用率高于 WARNING/CRITICAL 水平是正常的,而备份是 运行。但是,我每天都在这段时间收到问题和恢复通知...

由于这段时间应该考虑"normal"高CPU,那么处理这种情况的最佳方法是什么?

我会为此使用 "notification_period" 之类的东西吗?

我在想,如果 1:00 和 2:00 之间此主机的 CPU 很高,那么 ignore/don 不会在此期间发送通知。如果 2:00 后服务状态不正常,则发送通知...

如有任何想法或建议,我们将不胜感激!

最好的解决方案可能是在您的服务定义中使用 check_period 指令,因为 Nagios 没有 机器学习 之类的东西.
我建议您在日常备份期间禁用此服务的主动检查。 时间段的配置示例:

    define timeperiod{
         timeperiod_name               24X7custom
         alias                                   24X7custom
         sunday                               00:00-01:00,02:01-23:59
         monday                             00:00-01:00,02:01-23:59
         tuesday                             00:00-01:00,02:01-23:59
         wednesday                        00:00-01:00,02:01-23:59
         thursday                           00:00-01:00,02:01-23:59
         friday                                00:00-01:00,02:01-23:59
         saturday                           00:00-01:00,02:01-23:59
}