nagios.log 格式 - 字段定义

nagios.log format - field definition

我已经找了一个多小时了。我以为我在这里看到了什么,但我找不到了。

我正在寻找 nagios.log 的记录定义。具体来说,我想弄清楚这个数字代表什么。在这篇文章中,我想了解“1”是什么。

[1549377065] 服务警报:esgg;HTTP;严重;软;1;严重 - 套接字超时

我原以为这很容易找到,但我错了,或者只是迷路了。

与Nagios中的soft&hard机制有关
例如,如果您的服务 esgg 在您的服务定义中设置了 max_check_attempts 3,那么您将看到如下内容:

[1549377065] SERVICE ALERT: esgg;HTTP;CRITICAL;SOFT;1;CRITICAL - Socket timeout
[1549377195] SERVICE ALERT: esgg;HTTP;CRITICAL;SOFT;2;CRITICAL - Socket timeout
[1549377265] SERVICE ALERT: esgg;HTTP;CRITICAL;HARD;3;CRITICAL - Socket timeout

您需要连续检查 3 次错误才能获得 HARD 状态和通知。

在 Nagios 服务定义中,您设置了 "check interval"、"retry interval" 和 "max check attempts"。换句话说,nagios 将每 check interval 分钟检查一次服务,然后如果不正常,它将每 retry interval 分钟再次检查一次,检查一次 max check attempts 次。您指的是自服务进入 "non OK" 状态以来 Nagios 检查该服务的次数。它会递增,直到达到 max check attempts 或返回到 OK 状态。